O velikem jezikovnem modelu Llama, ki ga je ustvarila Meta, govorimo preredko, saj je njegov vpliv na področje UI resnično edinstven na svetu. Nekaj dni nazaj je Meta dala na voljo novo različico tega modela 3.1, ki je trenutno največji LLM (405 Milijard parametrov) in podpira več jezikov (originalno novico najdete tukaj).
Ampak poglejmo najprej, kaj je Llama in zakaj je tako pomembna. Veliki jezikovni modeli so v osnovi tehnologije, ki jih poganjajo velika podjetja (OpenAI, Microsoft, Google, Anthropic itd.), kar ima svoje prednosti in slabosti. Ta podjetja seveda lahko vložijo veliko denarja v te projekte, na drugi strani pa seveda omejujejo uporabo in določajo, kdo in kako jih lahko uporablja. Llama pa je na drugi strani odprtokodni model, ki ga lahko kdorkoli uporablja kakorkoli želi.
Odprtokodne tehnologije so vedno bile protiutež korporacijam in pogosto predstavljajo nemajhen tržni delež posamezne tehnologije. To spletno stran poganja odprtokodni sistem WordPress, velik del spletnih strežnikov teče na odprtokodnem Linuxu in še kaj.
Odprta koda pomeni, da lahko kdorkoli samostojno uporablja tehnologijo, si jo prenese na svoj računalnik in tam dela z njo (skoraj) karkoli. To omogoča, da vsakdo na podlagi te tehnologije pripravi svoj izdelek, poskrbi za znižanje cen in večjo dostopnost ter preprečuje tudi monopole.
Kako lahko uporabljam Llama 3.1 na svoji infrastrukturi
Kdorkoli lahko Llamo prenese na svoj računalnik (tukaj neposredno od Mete ali tukaj na Hugging Face). Vsako podjetje lahko sedaj prenese Llamo na svojo infrastrukturo, se ne ukvarja s cenovnimi modeli in omejitvami ter vprašanji zasebnosti, ampak enostavno poganjanj “svoj” LLM varno in poceni. Res je, da moramo zagotoviti velikanske računalnike, ki niso poceni, ampak to je pogosto ceneje, veliko pogosteje pa je to edini način, kako sploh izvajati nekatere procese.
Kako dober je Llama 3.1
Novost, torej model 405B, je največji model, kar jih imamo, in zato naj bi se po kakovosti uvrščal tudi na vrh, takoj za GPT-40 in GPT-40 mini, čeprav vsa testiranja še niso bila opravljena. V spodnji primerjavi lahko vidimo, da je Llama 3.1 405B v slabih petinah odgovorov boljši od GPT-40 in skoraj v četrtini odgovorov boljši od GPT-4-0125-Preview.

Manjše Llame 3.1, torej 70B in 8B različice, so po drugih testiranjih tudi boljše od GPT 3.5, kar lahko vidite na spodnji sliki.

Llama in slovenščina
Vse to je seveda odlično, dokler ne pridemo do vprašanja slovenščine, saj bo večina slovenskih rešitev pač zahtevala slovenščino. Tukaj se, kot ponavadi, stvari malo zakomplicirajo. Llama v osnovi ne podpira kar vseh jezikov povprek, kot smo tega navajeni od GPT-ja. Ena večjih nadgradenj, ki je prišla z verzijo 3.1, je ravno večje število jezikov. Llama sedaj deluje v angleščini, nemščini, francoščini, italijanščini, portugalščini, hindujščini, španščini in tajščini. Slovenščine torej ni na seznamu.
To pa ne pomeni, da Llama ne govori slovensko. Spodaj lahko vidite primerjavo med Llama 3.1 405B in GPT-4, kjer lahko vidimo, da je Llama povsem sprejemljivo napisala povzetek Kekčevih ukan, čeprav slovenščina ni ravno 100 %. Če bi radi sami opravili takšen test, uporabite spletno stran tukaj.

Peter Mesarec je verjetno najbolj poslušan predavatelj Chat GPT in UI v Sloveniji, njegovih predavanj o uporabi Chat GPT v podjetjih se je udeležilo več tisoč udeležencev, svoja znanja pa pogosto objavlja tukaj in na drugih spletnih straneh.