Nedavni primeri so pokazali, da tudi najnaprednejši sistemi umetne inteligence še vedno naletijo na presenetljive omejitve pri osnovnih opravilih, kot je črkovanje. Uporabniki so poročali, da so Googlovi AI modeli, vključno z Bardom in najnovejšim Gemini, večkrat napačno zapisali celo ime podjetja Google. Podobne nepravilnosti so zabeležene pri drugih sistemih, kot so OpenAI-jeve različice ChatGPT in Microsoft Copilot, kjer se algoritmi zapletejo pri črkovanju daljših ali manj pogostih besed. O teh izzivih poročajo številni tehnološki mediji, med njimi tudi TechCrunch in The Verge, ki so analizirali konkretne primere ter zbirali odzive uporabnikov in razvijalcev.

Tehnični razlogi za črkovalne napake

Večina naprednih AI modelov, kot so veliki jezikovni modeli (LLM), besedila obdeluje prek mehanizma tokenizacije, kjer se besede razbijejo na krajše enote oziroma tokene. Te enote niso nujno posamezne črke, kar pomeni, da model običajno ne »razume« besede na ravni črkovanja, temveč manipulira s pogostimi zaporedji znakov. Zato lahko pride do napak, ko model »ugiba« naslednji najverjetnejši token in s tem zgreši pravo črkovno zaporedje.

Za razliko od tradicionalnih preverjevalcev črkovanja, ki temeljijo na slovarjih in pogosto uporabljajo algoritme, kot je Levenshteinova razdalja za primerjavo podobnosti med besedami in za popravljanje napak, LLM modeli stavijo na statistično verjetnost. Namesto pravila ali ustaljenega niza vedno izbirajo tisto, kar je glede na analizirane podatke najverjetnejše, kar lahko vodi do napak, ki jih klasični sistemi običajno ne naredijo.

Na natančnost vplivajo tudi učni podatki. Če so v zbirki podatkov, na kateri je model treniran, prisotne ponavljajoče se tipkarske napake ali neobičajni zapisi besed, se lahko model nauči tudi teh napak. Na ta način se statistična verjetnost napačnih zapisov prenese v dejansko delovanje sistema, kar se odraža v nepričakovanih napakah v praksi.

Vpliv na uporabniško zaupanje ter možne rešitve

Ponovljene napake pri osnovnih nalogah, kot je črkovanje, vplivajo na uporabniško izkušnjo in zmanjšujejo zaupanje v umetno inteligenco. Uporabniki pričakujejo, da bodo napredni sistemi brezhibni, zato so presenečeni, ko naletijo na napake pri tako preprostem opravilu. Težave so bile izpostavljene v analizah na platformah, kot so TechCrunch in Wired, kjer razvijalci poudarjajo, da so omejitve posledica izbire osnovne arhitekture modelov in kompleksnosti nalog, ki jih želijo reševati.

Raziskovalci in podjetja razvijajo različne strategije za izboljšanje natančnosti. Ena od rešitev je združitev LLM z tradicionalnimi preverjevalci črkovanja, ki lahko delujejo kot filter ali zadnji korak pred končno predstavitvijo besedila uporabniku. Nekatera podjetja že preizkušajo hibridne modele, kjer jezikovni model generira besedilo, nato pa ga preveri in po potrebi popravi klasični preverjevalec.

Prihodnost razvoja na tem področju vključuje tudi fino nastavljanje modelov z uporabo specializiranih učnih sklopov, validacijo izhodov in uporabo algoritmov za nadzor kakovosti. Strokovnjaki menijo, da lahko uporabniki v naslednjih letih pričakujejo večjo natančnost UI pri osnovnih nalogah, saj se raziskave usmerjajo v kombinacijo zmogljivosti LLM in robustnosti tradicionalnih rešitev. Napredek bo odvisen od sodelovanja med raziskovalci, podjetji in uporabniki, ki skupaj oblikujejo smer razvoja umetne inteligence.

Ustanovitelj SEOS AI, predavatelj in svetovalec o uporabi umetne inteligence v podjetjih.

Leave A Reply

Exit mobile version