Google siger at deres nye AI-model Gemini overgår ChatGPT i de fleste tests

Gemini udgives også som en opgradering til Googles chatbot Bard. Google har præsenteret en ny kunstig intelligens-model, som de påstår overgår ChatGPT i de fleste tests og udviser “avanceret ræsonnering” på tværs af flere formater, herunder en evne til at se og bedømme en students fysikopgaver.

Modellen, kaldet Gemini, er den første, der er blevet annonceret siden sidste måneds globale AI-sikkerhedstopmøde, hvor teknologivirksomheder blev enige om at samarbejde med regeringer om at teste avancerede systemer før og efter deres udgivelse. Google sagde, at de var i samtaler med Storbritanniens nydannede AI Safety Institute. Det skriver bl.a. the Guardian og Google.

Google sagde, at Ultra overgik “topmoderne” AI-modeller, herunder ChatGPT’s mest kraftfulde model, GPT-4, i 30 ud af 32 benchmark-tests, herunder i ræsonnering og billedforståelse. Pro-modellen overgik GPT-3.5, teknologien bag den gratis version af ChatGPT, i seks ud af otte tests.

GEMINI, ULTRA, PRO OG NANO UDGAVER

Gemini bliver lanceret i tre udgaver:

En minimal ‘nano’-udgave, der kan køre på enkelte Android-telefoner, der forventes først at være introduceret på Googles egne telefoner
En såkaldt ‘pro’-udgave, der allerede nu kan findes under kølerhjelmen på chatbotten Bard (dog ikke på dansk)
En særlig kraftfuld ‘ultra’-udgave, der skal tage konkurrencen op med OpenAI’s GPT4-model

Sammenligning mellem Gemini og CHATGPT4

Som det fremgår af Google’s Gemini hjemmeside er der forbedringer at hente med Gemini, og meget tyder på at Google har indhentet OpenAI i sin tilgang.

Dertil kommer at Google formentligt at trænet sin AGI model med alle lukkede dele af Internettet, det vil sige de websteder som koster penge.

Modellen kommer i tre versioner og er “multimodal”, hvilket betyder, at den kan forstå tekst, lyd, billeder, video og computerkode simultant.

Gemini, som vil blive integreret i Google-produkter, herunder deres søgemaskine, udgives oprindeligt i mere end 170 lande, herunder USA, onsdag i form af en opgradering til Googles chatbot, Bard.

Dog vil Bard-opgraderingen ikke blive udgivet i Storbritannien og Europa, mens Google søger godkendelse fra regulatorer. Dette kan forventes indenfor 1-3 måneder.

Demis Hassabis, direktøren for DeepMind, den London-baserede Google-afdeling, der udviklede Gemini, sagde: “Det har været det mest komplicerede projekt, vi nogensinde har arbejdet på; jeg vil sige det største foretagende. Det har været en enorm indsats.”

To mindre versioner af Gemini, Pro og Nano, vil blive udgivet onsdag. Pro-modellen kan tilgås på Googles Bard-chatbot, og Nano-versionen vil være på mobiltelefoner, der bruger Googles Android-system.

Den mest kraftfulde iteration, Ultra, testes eksternt og vil ikke blive udgivet offentligt før tidligt i 2024, hvor den også vil blive integreret i en version af Bard kaldet Bard Advanced.

Google sagde, at Ultra var den første AI-model, der overgik menneskelige eksperter, med en score på 90%, i en multitasking-test kaldet MMLU, som dækker 57 emner, herunder matematik, fysik, jura, medicin og etik.

AlphaCode2 TIL UDVIKLING OG PROGRAMMERING

Ultra vil nu drive et nyt kode-skriveredskab kaldet AlphaCode2, som Google påstod kunne overgå 85% af konkurrenceniveauets menneskelige computerprogrammører. Det er dette skriveredskab vi er mest interesseret i fordi kvaliteten af vor kodning bliver bedre, mere sikker men også bliver billigere. Det er dermed på alle paramtre at Agil Udvikling A/S kan være med i konkurrencen, også fordi vi har indgående ekspertise i Google Cloud, Firebase, APP udvikling m.v. fra Google.

Hassabis sagde, at Ultra-modellen ville gennemgå ekstern “red team”-testning – hvor eksperter tester sikkerheden og sikkerheden af et produkt – og Google ville dele resultaterne med den amerikanske regering, i overensstemmelse med en præsidentordre udstedt af Joe Biden i oktober.

Spurgt om Gemini var blevet testet i samarbejde med den amerikanske eller britiske regering, som fastsat på AI-sikkerhedstopmødet i Bletchley Park, sagde Hassabis, at Google var i diskussion med den britiske regering om, at AI Safety Institute skulle udføre tests på modellen.

“Vi diskuterer med dem, hvordan vi ønsker, at de skal gøre det,” sagde han. Pro- og Nano-modellerne vil ikke være en del af testene, som er for de mest avancerede eller “frontlinje”-modeller.

Sissie Hsiao, generalsekretæren for Bard hos Google, sagde, at den Pro-drevne version af Bard endnu ikke ville blive udgivet i Storbritannien

Den udgives heller ikke i Det Europæiske Økonomiske Samarbejdsområde, som inkluderer EU og Schweiz. Hun sagde: “Vi arbejder med lokale regulatorer.” Google specificerede ikke de regulatoriske problemer bag forsinkelserne i Storbritannien og EU.

Dog indikerede Google, at “hallucinationer” eller falske svar stadig var et problem med modellen. “Det er stadig, vil jeg sige, et uløst forskningsproblem,” sagde Eli Collins, produktchefen hos Google DeepMind.

Selvom alle Gemini-versionerne er multimodale i forhold til de prompts, de kan forstå, kan Pro- og Nano-iterationerne, der offentligt udgives denne måned, i øjeblikket kun svare i tekst- eller kodeformat.

GEMINI

Google udgav promoveringsvideoer af Geminis kapabiliteter, som inkluderede at vise Ultra-modellen, der forstod en students håndskrevne fysikopgavesvar og gav detaljerede tips til, hvordan man løser spørgsmålene, herunder at vise ligninger.

Andre videoer viste Geminis Pro-version analysere og identificere en tegning af en and samt korrekt svare på, hvilken film en person agerede i en smartphonevideo – i dette tilfælde en amatørisk version af den berømte “bullet time”-scene i The Matrix.

Collins sagde, at Geminis mest kraftfulde tilstand havde vist “avanceret ræsonnering” og kunne vise “nye kapabiliteter” – en evne til at udføre opgaver, som ikke tidligere er vist af AI-modeller.

AI BEKYMRINGER

Bekymringer over AI – betegnelsen for computersystemer, der kan udføre opgaver, der normalt kræver menneskelig intelligens – spænder fra masseproduceret misinformation til skabelsen af “superintelligente” systemer, der undviger menneskelig kontrol. Nogle eksperter er bekymrede for udviklingen af kunstig generel intelligens, som refererer til en AI, der kan udføre en række opgaver på et menneskeligt eller over-menneskeligt intelligensniveau.

Spurgt om Gemini repræsenterede et vigtigt skridt mod AGI, sagde Hassabis: “Jeg tror, at disse multimodale grundlæggende modeller kommer til at være en nøglekomponent i AGI, hvad end det endelige system viser sig at være. Men der er stadig ting, der mangler, som vi stadig forsker i og innoverer på nu.”

Hassabis sagde, at dataene, der blev brugt til at træne Gemini, var taget fra en række kilder, herunder det åbne web. Udgiver- og kreative industrier har protesteret over AI-virksomheder, der bruger ophavsretligt beskyttet indhold, som er tilgængeligt online, til at opbygge modeller.

Udover at de nye teknolohier formentligt først opdateres på Google Pixel telefoner og Google Cloud kan vi se frem til opdateringer af BARD, som er undertals konkurrence med ChatGPT, der pt. er verdens mest anvendte AI model, men dette er definitivt et trin i både retning af udviklere, app udviklere og som forretningsmodel er det nemt at indkluderer disse teknologier, vi afventer dog og at se hvilke API muligheder der er tilgængelige i de største versioner.

På en skala fra 0 til 5 giver jeg 5 til dette teknologiske fremskridt for Google da det er anvedeligt umiddelbart i udviklingsbranchen, og for samtlige indenfor ekspertområder som f.eks. advokat, revisor, læge og meget andet.

Gemini Videoer: (KILDE: Google)

Vedr. programmeringskode (for os programmører)

Kilde: Google, Theguardian, Agil Udvikling A/S, Michael Rasmussen
Video og Fotokredit: Google