Na prometnem avtobusu v Mumbaju prodajalec sadja v hindijščini vpraša svojega pametnega telefon, kje je najbližja tržnica. Namesto odgovora prejme zmeden odgovor – umetna inteligenca ni razumela njegovega dialekta. V državi z več kot 1,4 milijarde prebivalcev in neverjetno jezikovno raznolikostjo postajajo takšni trenutki pogosti. Prav tu svojo priložnost vidi podjetje Wispr z rešitvijo Flow, ki želi premikati meje glasovne umetne inteligence v Indiji.
Jezikovna raznolikost in tehnični izzivi na indijskem trgu
Indija uradno priznava 22 jezikov in več kot 1200 dialektov, vsak s svojo izgovorjavo in značilnostmi. Wispr Flow trenutno podpira 12 indijskih jezikov, vključno s hindijščino, bengalščino, tamilščino in maratščino, s ciljem razširitve na več kot 20 do konca leta. Poseben primer je tamilščina, kjer razlika med urbanim in ruralnim naglasom zahteva dodatno učenje modela, saj številne besede dobijo drug pomen ali obliko glede na regijo.
Približno 60 odstotkov uporabnikov pametnih telefonov v Indiji uporablja naprave, starejše od treh let, medtem ko 40 odstotkov nima stalne internetne povezave. Flow uporablja hibridni pristop, ki omogoča prepoznavanje glasovnih ukazov neposredno na napravi brez povezave v oblak, kar je ključno za neprekinjeno delovanje v podeželskih in oddaljenih regijah.
Izrazita razlika Flow v primerjavi z globalnimi rešitvami je optimizacija za lokalne pogoje. Flow uporablja strojno učenje na robu naprave (“edge AI”) z modelom, ki zahteva do 40 odstotkov manj procesorske moči kot tipične primerljive rešitve. To se odraža v hitrejši odzivnosti in nižji porabi baterije, kar je bistveno za uporabnike s starejšimi napravami.
Konkurenca, inovativnost in prihodnji izzivi
Poleg Wisprja so na indijskem trgu prisotni tudi globalni igralci, kot sta Google Assistant in Amazon Alexa, pa tudi lokalna tekmeca Reverie in Haptik. Medtem ko Google Assistant uradno podpira hindijščino in še nekaj drugih jezikov, Flow izstopa z razširjeno podporo regionalnim dialektom ter hitrim učenjem iz napak uporabnikov. Wisprjev model temelji na adaptivnem učenju in sprotnem prilagajanju glede na povratne informacije z različnih delov Indije.
Tehnična inovacija Flow je predvsem v načinu obdelave podatkov v realnem času brez nalaganja podatkov v oblak. Njihova rešitev temelji na kompaktnem nevralnem modelu, ki lokalno prepoznava glas in avtomatično optimizira pogostejše ukaze za posamezno regijo. S tem zagotavljajo zasebnost in varnost podatkov, kar je v Indiji zaradi občutljivosti uporabnikov posebej pomembno.
Prihodnost za podjetje Wispr prinaša številne priložnosti in izzive. Njihova strategija vključuje tudi partnerstva z izobraževalnimi in zdravstvenimi ustanovami ter ponudniki državnih storitev, kjer lahko glasovna AI pospeši digitalizacijo. Kljub temu bodo morali nasloviti vprašanja monetizacije, etičnih dilem glede zbiranja jezikovnih podatkov ter prilagajanja hitro spreminjajočim se predpisom na področju umetne inteligence.

