Umetna inteligenca: Virtuozinja simulacij, improvizatorka resnice

17. december 2024

Umetna inteligenca je v fascinantnem, a tudi paradoksalnem obdobju razvoja. Po eni strani ima izjemno sposobnost prepoznavanja vzorcev, lahko bi rekli intuicijo, po drugi strani pa nas pogosto preseneti z napakami pri stvareh, ki so ljudem samoumevne. Raziskave kažejo, da je posploševanje znanja na nove situacije še vedno eden največjih izzivov umetne inteligence. Kljub tej temeljni omejitvi pa smo bili v zadnjem letu priča številnim pomembnim napredkom.

Eden najbolj opaznih trendov v letu 2024 je bil premik od velikih jezikovnih modelov k manjšim, a izjemno učinkovitim različicam. Ta presenetljiv obrat nakazuje, da samo povečevanje modelov morda ne prinaša več želenih rezultatov – bodisi zaradi omejene količine kakovostnih podatkov za učenje ali pa zaradi omejitev trenutnega pristopa k treniranju modelov. To lahko vidimo pri vseh vodilnih podjetjih na področju umetne inteligence. (Google je s svojim Gemini 2.0 Flash pokazal, da lahko tudi manjši model doseže izjemne rezultate in v nekaterih primerih celo prekaša večje modele prejšnje generacije. Anthropic sledi podobnemu pristopu, saj za svojo serijo Claude 3.5 ni izdal največjega modela Opus, ampak se je osredotočil na manjše, a zelo zmogljive modele kot sta Sonnet in Haiku . Podobno lahko špekuliramo glede OpenAI, da GPT-4o ni njihov največji možni model.)

Vzporedno s tem trendom smo priča vzponu večmodalnim modelom umetne inteligence, ki lahko hkrati procesirajo besedilo, slike, zvok in video. V kombinaciji z izboljšano učinkovitostjo to odpira vrata številnim novim možnostim uporabe interaktivnega sodelovanja z umetno inteligenco v realnem času, kot so na primer glasovna komunikacija z umetno inteligenco med deljenjem zaslona, interaktivno sodelovanje v generiranih podkastih in klepetanje z virtualnimi osebami na Zoom sestankih.

Vzporedno z napredkom v interaktivnosti se razvijajo tudi rešitve za izboljšanje kakovosti odgovorov umetne inteligence. Eden od pristopov je omogočanje dostopa do zunanjih virov informacij. Tako kot pri televizijskem kvizu tekmovalec uporabi “klic v sili” in pokliče prijatelja za pomoč, lahko taka umetna inteligenca preveri informacije v zunanjih virih – spletu, podatkovnih bazah ali specifičnih dokumentih. Čeprav to pomembno zmanjša možnost napak, še vedno ni popolna rešitev – umetna inteligenca lahko namreč napačno interpretira tudi pravilne informacije iz teh virov.

Drugačen pristop k izboljšanju kakovosti pa je razvil OpenAI s svojim sistemom o1, ki bolje izkorišča že obstoječe znanje modelov. Tako kot pri televizijskem kvizu tekmovalec uporabi “glas ljudstva”, da dobi odgovor od več ljudi hkrati, tudi o1 združi več pogledov na problem, tako da preko notranjega dialoga razvije različne perspektive in jih poveže v končno rešitev.

Kljub vsem izboljšavam umetni inteligenci še vedno manjka tisto, čemur bi lahko rekli “zdrava kmečka pamet”, zato je pri izvajanju opravil potrebna človeška presoja. Industrija se sicer usmerja k razvoju sistemov, ki bi bili sposobni samostojnega izvajanja določenih opravil, vendar ostaja vprašanje, ali bo za dosego tega cilja zadostovala postopna optimizacija obstoječih pristopov, ali pa bo potreben večji konceptualni preboj v sami zasnovi umetne inteligence.