V torek, 10. septembra, so uporabniki storitev podjetja Anthropic doživeli izpad, ki je trajal približno štiri ure, od 11.30 do 15.40 po srednjeevropskem času. Nedelovanje je zajelo tako platformo Claude kot razvijalsko konzolo, kar je povzročilo prekinitev avtomatiziranih procesov pri več podjetjih in motnje pri običajnih uporabnikih. Anthropic je po incidentu sporočil, da je težava prizadela vse uporabnike njihovih oblačnih storitev v Severni Ameriki in Evropi, skupno več tisoč računov, ki se vsak dan zanašajo na njihove AI rešitve za obdelavo podatkov ter avtomatizacijo internih procesov.
Izpad Claudea ohromil delo podjetij in razvijalcev
Izpad je neposredno prizadel podjetja iz finančne in tehnološke panoge, med katerimi so bili največji vplivi zabeleženi pri razvijalcih, ki so Claude API uporabljali za avtomatsko pripravo poročil in podporo spletni pomoči strankam. Nekateri uporabniki so poročali o odpovedi tisočev avtomatiziranih zahtevkov, motenih spletnih nakupovalnih procesih in zamudah pri izvajanju analiz podatkov. Po podatkih podjetja je storitev Claude v času izpada obdelovala v povprečju več kot 500.000 zahtevkov na uro, kar je bilo v kritičnih urah popolnoma onemogočeno.
Podjetja, kot so start-upi s področja e-trgovine in razvijalci SaaS rešitev, so ostala brez dostopa do ključnih funkcij, kot je generiranje povzetkov dokumentov ali integracija klepetalnih botov za podporo strankam. Nekateri so bili prisiljeni začasno ustaviti storitve svojim komitentom ali uporabnikom, saj niso mogli zagotoviti osnovnih funkcij. Uporabniki so v tem času iskali alternativne rešitve, vendar je bila večina procesov vezanih izključno na storitve Claude.
Antropičev statusni portal in družbena omrežja so beležili izjemno povečano število poizvedb in pritožb. Uporabniki so poročali o neuspelih integracijah prek API-ja ter prejemali obvestila o napakah ob vsakem poskusu uporabe Claude platforme. Poročila z različnih koncev Evrope in ZDA so potrjevala, da je šlo za globalno motnjo, ki je bila odpravljena šele pozno popoldne.
Anthropic pojasnjuje vzrok izpada in napoveduje izboljšave
Anthropic je pojasnil, da je bil vzrok izpada napaka v upravljanju oblačne infrastrukture, ki je povzročila prekinitve povezav med posameznimi strežniškimi vozlišči. Podjetje ni razkrilo natančnih tehničnih podrobnosti, vendar je v uradnem obvestilu izpostavilo, da ni šlo za zlonamerni napad ali varnostno ranljivost, temveč za interni tehnični problem. Po navedbah tehnične ekipe je bil zaustavljen sistem avtomatske prerazporeditve bremen, kar je povzročilo verižno nedostopnost ključnih storitev.
Podjetje je uporabnike v času izpada obveščalo preko statusne strani ter napovedalo, da bodo izvedli celovit pregled vseh internih sistemov in protokolov za upravljanje prometa. Obljubljajo okrepljen nadzor in uvedbo dodatnih mehanizmov za zaznavanje in preprečevanje podobnih težav. Po podatkih iz uradnega poročila podjetje pričakuje, da bo po prenovi sistemov odpornost infrastrukture bistveno večja.
Strokovnjaki s področja podatkovnih centrov so poudarili, da so takšni izpadi pri hitro rastočih oblačnih platformah možni predvsem zaradi kompleksnosti sodobnih arhitektur. Po njihovem mnenju so ključni izzivi pravočasno odkrivanje ozkih grl in izobraževanje osebja za hitro odzivanje. Opozorili so tudi na pomen proaktivne komunikacije z uporabniki, ki v primeru motenj pričakujejo natančne informacije in jasna pojasnila.