anthropic claude 3.5

Claude 3.5 Sonnet je tukaj in veliko boljši

Generativna Umetna Inteligenca

Rival OpenAI, Anthropic, predstavlja nov močan model generativne umetne inteligence, imenovan Claude 3.5 Sonnet. Vendar gre bolj za manjšo izboljšavo, kot za velik skok naprej.

Model Claude 3.5 Sonnet lahko analizira besedila in slike ter generira besedilo. Po navedbah podjetja gre za njihov doslej najbolje delujoči model — vsaj na papirju. V različnih merilih umetne inteligence za branje, programiranje, matematiko in vidik, Claude 3.5 Sonnet prekaša model, ki ga nadomešča, Claude 3 Sonnet, in presega prejšnji paradni model podjetja, Claude 3 Opus.

Merila niso nujno najboljši pokazatelj napredka AI, deloma zato, ker mnoga testirajo eksotične mejne primere, ki za povprečnega uporabnika niso uporabni, na primer odgovarjanje na vprašanja iz zdravstvenih izpitov. Vendar, če je to kaj vredno, Claude 3.5 Sonnet komaj prekaša vodilne konkurenčne modele, vključno z nedavno predstavljenim modelom GPT-4o od OpenAI, na nekaterih merilih, proti katerim je bil testiran.

Ob novem modelu Anthropic predstavlja tudi nekaj, kar imenujejo Artifakti, delovni prostor, kjer uporabniki lahko urejajo in dodajajo vsebino — na primer kodo in dokumente — ki so jo generirali modeli Anthropic. Trenutno v predogledu, Artifakti bodo kmalu dobili nove funkcije, kot so načini sodelovanja z večjimi ekipami in shranjevanje baz znanja, pravi Anthropic.

Osredotočenost na učinkovitost

Claude 3.5 Sonnet je nekoliko bolj zmogljiv kot Claude 3 Opus, in Anthropic pravi, da model bolje razume niansirana in kompleksna navodila, poleg konceptov, kot je humor. (Čeprav je AI znan po tem, da ni smešen.) Vendar morda pomembneje za razvijalce aplikacij z Claudom, ki zahtevajo hitre odzive (na primer klepetalne robote za podporo strankam), je Claude 3.5 Sonnet hitrejši. Je približno dvakrat hitrejši od Claude 3 Opus, trdi Anthropic.

Vidik — analiziranje fotografij — je področje, kjer se Claude 3.5 Sonnet močno izboljša v primerjavi s 3 Opus, po navedbah podjetja Anthropic. Claude 3.5 Sonnet lahko natančneje interpretira grafe in diagrame ter prepisuje besedilo iz “nepopolnih” slik, kot so slike z izkrivljanji in vizualnimi artefakti.

Michael Gerstenhaber, vodja proizvoda pri Anthropic, pravi, da so izboljšave rezultat arhitekturnih prilagoditev in novih podatkov za usposabljanje, vključno z AI generiranimi podatki. Katere podatke točno? Gerstenhaber ni razkril, vendar je namignil, da Claude 3.5 Sonnet črpa veliko svoje moči iz teh naborov podatkov.

Pomembno je, ali AI podjetjem pomaga doseči njihove poslovne cilje, ne to, ali je AI konkurenčen na merilu,” je za TechCrunch povedal Gerstenhaber. “In iz tega vidika verjamem, da bo Claude 3.5 Sonnet velik korak naprej pred vsem drugim, kar imamo na voljo — in tudi pred vsem drugim v industriji.

Skrivnostnost glede podatkov za usposabljanje bi lahko bila zaradi konkurenčnih razlogov. Lahko pa tudi, da želi Anthropic s tem zaščititi sebe pred pravnimi izzivi — zlasti izzivi, ki se nanašajo na pošteno uporabo. Sodišča še niso odločila, ali imajo ponudniki, kot so Anthropic in njegovi konkurenti, kot so OpenAI, Google, Amazon in tako naprej, pravico usposabljati na javnih podatkih, vключno z avtorsko zaščitenimi podatки, brez plačila ali navajanja ustvarjalcev teh podatkov.

Torej, vse kar vemo je, da je bil Claude 3.5 Sonnet treniran na veliko besedila in slik, podobno kot prejšnji modeli Anthropica, plus povratnih informacijah od človeških preizkuševalcev, da poskušajo “uskladiti” model z nameni uporabnikov, upajmo, da preprečuje oddajanje toksičnega ali drugače problematičnega besedila.

Kaj še vemo? No, okno konteksta Claude 3.5 Sonnet — količina besedila, ki ga model lahko analizira, preden generira novo besedilo — je 200.000 žetonov, enako kot pri Claude 3 Sonnet. Žetoni so poddeljeni kosi surovih podatkov, kot so zlogi “fan”, “tas” in “tic” v besedi “fantastic”; 200.000 žetonov je enako približno 150.000 besedam.

In vemo, da je Claude 3.5 Sonnet na voljo že danes. Brezplačni uporabniki Anthropičnega spletnega odjemalca in aplikacije Claude iOS ga lahko dostopajo brezplačno; naročniki na plačljive načrte Anthropic, Claude Pro in Claude Team, prejmejo 5-krat višje omejitve hitrosti. Claude 3.5 Sonnet je tudi v živo na Anthropičnem API-ju in upravljanih platformah, kot sta Amazon Bedrock in Googlov Vertex AI.

“Claude 3.5 Sonnet resnično predstavlja korak naprej v inteligenci, ne da bi žrtvovali hitrost, in nas pripravlja na prihodnje izdaje v celotni družini modelov Claude,” je povedal Gerstenhaber.

Claude 3.5 Sonnet prav tako poganja Artifakte, ki odprejo posebno okno v spletnem odjemalcu Claude, ko uporabnik model prosi za generiranje vsebine, kot so izrezki kode, tekstovni dokumenti ali oblikovanje spletnih strani. Gerstenhaber pojasnjuje: “Artifakti so izhod modela, ki postavi generirano vsebino na stran in vam, kot uporabniku, omogoča, da na tej vsebini iterirate. Recimo, da želite generirati kodo — artifakt bo postavljen v uporabniški vmesnik, nato pa lahko s Claudom komunicirate in iterirate dokument, da ga izboljšate, tako da lahko kodo izvedete.”

Širša slika


Kakšen je torej pomen Claude 3.5 Sonnet v širšem kontekstu Anthropica — in ekosistema AI?

Claude 3.5 Sonnet kaže, da je postopni napredek tisto, kar lahko pričakujemo trenutno na področju modelov, razen če pride do večjega raziskovalnega preboja. V zadnjih mesecih so se zgodile paradne izdaje od Googla (Gemini 1.5 Pro) in OpenAI (GPT-4o), ki premikajo iglo le rahlo v smislu merilne in kvalitativne zmogljivosti. Toda skok, primerljiv s prehodom od GPT-3 do GPT-4, že nekaj časa ni bil dosežen, zaradi togosti današnjih arhitektur modelov in ogromne računalniške moči, ki je potrebna za njihovo usposabljanje.

Ko se ponudniki generativne umetne inteligence osredotočajo na kuracijo podatkov in licenciranje namesto na obetavne nove skalabilne arhitekture, so znaki, da vlagatelji postajajo previdni glede daljše od pričakovane poti do donosnosti naložbe za generativno AI. Anthropic je do neke mere zaščiten pred tem pritiskom, saj je v zavidljivem položaju Amazonovega (in v manjši meri Googlovega) zavarovanja proti OpenAI. Toda prihodki podjetja, ki naj bi do konca leta 2024 dosegli skoraj 1 milijardo dolarjev, so le delček prihodkov OpenAI — in prepričan sem, da Anthropični vlagatelji tega ne pozabijo.

Tako Anthropic sprejema strateški in že prehojen pristop k prodiranju, z vlaganjem časa za razvoj izdelkov, kot je Claude 3.5 Sonnet, za zagotovitev nekoliko boljše zmogljivosti po dostopnejših cenah. Cena Claude 3.5 Sonnet je enaka kot pri Claude 3 Sonnet: 3 dolarje za milijon žetonov, ki so vneseni v model, in 15 dolarjev za milijon žetonov, ki jih model generira.

Gerstenhaber je o tem govoril v pogovoru za TechCrunch “Ko gradite aplikacijo, končni uporabnik ne bi smel vedeti, kateri model se uporablja ali kako je inženir optimiziral njihovo izkušnjo,” je rekel, “ampak inženir bi moral imeti na voljo orodja za optimizacijo te izkušnje po vektorjih, ki jih je treba optimizirati, in stroški so zagotovo eden izmed njih.”

Claude 3.5 Sonnet ne reši problema halucinacij. Skoraj zagotovo dela napake. Toda morda je dovolj privlačen, da razvijalci in podjetja preidejo na Anthropično platformo. In na koncu dneva, to je tisto, kar je za Anthropic pomembno.

Z istim ciljem je Anthropic podvojil orodja, kot je njegov eksperimentalni AI za krmiljenje, ki razvijalcem omogoča “krmiljenje” notranjih lastnosti svojih modelov; integracije, ki omogočajo modelom izvajanje dejanj znotraj aplikacij; in orodja, zgrajena na vrhu svojih modelov, kot je omenjena izkušnja z Artifakti. Zaposlil je tudi soustanovitelja Instagrama kot vodjo izdelkov. In širil razpoložljivost svojih izdelkov, nazadnje s pripeljavo Clauda v Evropo in vzpostavitvijo pisarn v Londonu in Dublinu.

Anthropic, se zdi, da se je sprijaznil z idejo, da je gradnja ekosistema okoli modelov — ne le modelov v izolaciji — ključ do zadrževanja strank, ko se vrzel v zmogljivostih med modeli zožuje.

Kljub temu je Gerstenhaber vztrajal, da so na obzorju večji in boljši modeli — kot je Claude 3.5 Opus — z lastnostmi, kot so spletno iskanje in sposobnost zapomniti si preference.

“Še nisem videl, da bi se globoko učenje zaletelo v zid, in prepustil bom raziskovalcem, da ugibajo o zidu, toda mislim, da je malo prezgodaj sklepati o tem, še posebej, če pogledate hitrost inovacij,” je rekel. “Razvoj in inovacije so zelo hitri, in nimam razloga verjeti, da se bo to upočasnilo.”

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja