Google je najavio nadogradnju za svoj generativni AI chatbot, Bard, koji će sada biti pokretan Gemini, najnovijim i najnaprednijim AI modelom kompanije. Ovo će značajno poboljšati sposobnosti Barda, uključujući naprednije rezonovanje, planiranje, razumijevanje i druge mogućnosti.
Gemini dolazi u tri veličine: Ultra, Pro i Nano, što mu omogućava rad na različitim platformama, od mobilnih uređaja do podatkovnih centara.
Implementacija Gemini u Bard odvijat će se u dvije faze. U početku će Bard biti nadograđen posebno prilagođenom verzijom Gemini Pro. Naredne godine, Google će predstaviti Bard Advanced, koji će korisnicima pružiti pristup najboljem AI modelu, počevši od Gemini Ultra.
Verzija Barda s Gemini Pro prvo će biti dostupna na engleskom jeziku u više od 170 zemalja i teritorija širom svijeta, uskoro i na drugim jezicima i u drugim zemljama, uključujući EU i Ujedinjeno Kraljevstvo.
Prije lansiranja u javnost, Gemini Pro je testiran kroz niz industrijskih standardnih benchmark testova, i u šest od osam takvih testova, Gemini je nadmašio GPT-3.5, kaže Google. To uključuje bolje performanse na MMLU, ili masovnim višezadaćnim zadacima razumijevanja jezika, koji je jedan od ključnih standarda za mjerenje velikih AI modela. Također je nadmašio na GSM8K, koji mjeri razumijevanje matematike na razini osnovne škole. Međutim, kako je Kyle Wiggers iz TechCrunch-a istaknuo, GPT-3.5 je stariji od godinu dana, što ovu nadogradnju čini više hvatanjem koraka nego nadmašivanjem.
Poboljšanja će učiniti Bard sposobnijim u pogledu stvari poput razumijevanja i sažimanja sadržaja, rezonovanja, brainstorminga, pisanja i planiranja, napominje kompanija.
„Ovo je najveće pojedinačno poboljšanje kvalitete Barda od kada smo ga pokrenuli,“ rekla je Sissie Hsiao, potpredsjednica i generalna menadžerica za Asistenta i Bard u Googleu, prilikom predstavljanja nadogradnje Barda na konferenciji za novinare.
Gemini Pro će prvo pokretati tekstualne upite u Bardu, rekla je Hsiao, ali će se proširiti na multimodalnu podršku - što znači tekstove i slike ili druge modalitete - u narednim mjesecima.
U 2024. godini, Bard Advanced će debitovati, što će biti novo iskustvo pokretano najmoćnijim modelom Gemini. S Gemini Ultra, kako se naziva, AI može razumjeti i djelovati na različite vrste informacija, uključujući tekst, slike, audio, video i kod, te ima sposobnosti multimodalnog razumijevanja. Gemini Ultra može također razumjeti, objasniti i generirati visokokvalitetan kod na popularnim programskim jezicima, kaže Google, pored razumijevanja audio i video sadržaja. Ova nadogradnja izgleda da će biti ona koju vrijedi čekati.
Kompanija kaže da će pokrenuti program pouzdanih testera za Bard Advanced prije širenja pristupa korisnicima početkom sljedeće godine. Osim toga, Google će provesti dodatne sigurnosne provjere Bard Advanceda prije njegovog lansiranja.
Nadogradnja slijedi niz drugih poboljšanja Barda od njegovog debija prije osam mjeseci. U posljednjih nekoliko mjeseci, iskustvo s AI je poboljšano funkcijama poput sposobnosti odgovaranja na pitanja o YouTube videima, kao i pristupa korisničkim Google aplikacijama, poput Gmaila, Dokumenata, Drivea i drugih, te drugih Google usluga kao što su Google Letovi i hoteli. Također može provjeravati svoje odgovore kako bi se utvrdilo da li AI "halucinira" - to jest, kada pruža odgovor zasnovan na lažnim informacijama.
"Sada s Gemini, korak smo bliže da vam donesemo najboljeg AI saradnika na svijetu," istakla je Hsiao. To barem zvuči iskrenije, jer je priznanje da Bard još uvijek nije sasvim tamo.