I dag har vi som betatestere set frem til lanceringen af et af de mere banebrydende videoproduktions software der findes. OpenAI’s teknologi, SORA, er som en revolution inden for kunstig intelligens. Med sit avancerede design og alsidige anvendelsesmuligheder sætter SORA nye standarder for, hvad AI kan præstere, og åbner op for nye horisonter inden for teknologi, forskning og erhvervslivet. Ring 77777712 for mere om hvordan vi tilbyder dette i Microsoft Azure eller på f.eks. Simply med et webhotel.
Hvad er SORA?
SORA er en avanceret AI udviklet af OpenAI, designet til at håndtere en bred vifte af opgaver, der spænder fra naturligsprogsforståelse til komplekse beregningsopgaver. Der er tale om videorendering af millioner af kilder hvor 1 minut’s rendering tager 1-4 minutter afhængigt af objekter og især lys og skygge.
Filformatet kan indhentes i mange andre programmer jeg har her på kontoret, men der kommer nogle scenebegrænsninger, farveproblemer og gausian, men nu er det jo heller ikke beregnet til dette formål, det er nok mere den anden vej f.eks. med interpolering af 2 videoer, hvilket er det mest imponerende jeg har set.
Hollywood Studier i et tekstprompt
Denne teknologi repræsenterer en milepæl i bestræbelserne på at skabe mere fleksible og effektive AI-systemer, som kan tilpasse sig og lære fra en mangfoldighed af scenarier uden behov for omfattende omprogrammering. Dog skal man omskrive sin tekst 20-30 gange før man er tilfreds. Der er intet problem i kvaliteten med det der foreslås.
Jeg forudser personlige en eksplosion af nye spil, undervisningsfirmaer, chatbots der fortæller som video hvad man spørger om på en hver hjemmeside. Vi er nu alle poå vej til at blive assistenter der kan læse alt muligt op, men grænsen går ved 1 minut. Foreløbigt. Man kan producerere hele Hollywood film.
Agil Udvikling A/S tilbyder inden længe et dansksproget API hvor du kan implementere AI Videogenerering, med tekster, logo, rulletekster, musik, tale og specielle videoeffekter såsom sceneskift med pixelering m.v. Afhængigt af licens og prisvilkår vil dette koste fra 99 kr. pr. måned.
SORA har samarbejdet med contentleverandører såsom Shutterstock og andre lukkede biblioteker, disse kan benyttes til f.eks. at skifte landskab, tid, årstid, vejrtype og alt skiftes ud løbende eller kan undgå som en del af videon.
SORA, udviklet af OpenAI, er en banebrydende kunstig intelligens, som har potentialet til at revolutionere en række felter og industrier med sin avancerede teknologi. Her er nogle af de primære anvendelser, hvor SORA kan bruges til at producere bemærkelsesværdige resultater:
https://twitter.com/videossora
SORA’s alsidighed og kraft gør den til et værktøj med næsten ubegrænsede anvendelsesmuligheder, der kan transformere, hvordan vi arbejder med og interagerer med teknologi på tværs af alle sektorer.
Se alle SORA video eksempler:
Anvendelsesområder for SORA
SORA’s potentiale er vidtrækkende og inkluderer en række anvendelsesområder. Især alt indenfor visualisering får en overhaling med SORA. Især også f.eks. arkitekter der du kan betragte deres værk i 3D og med forskellige add-ons.
Her er en liste over 30 potentielle anvendelser af OpenAI’s SORA:
Nr. | SORA VIDEO AI Anvendelse |
---|---|
1 | Generering af realistiske videoer til markedsføringskampagner |
2 | Oprettelse af uddannelsesmateriale med visuelle demonstrationer |
3 | Simulering af scenarier for forskning og udvikling |
4 | Produktion af kortfilm eller animationsfilm |
5 | Design af virtuelle ture eller rejseoplevelser |
6 | Skabelse af interaktive historier eller videospil |
7 | Visualisering af komplekse data eller koncepter |
8 | Fremstilling af produktprototyper eller design |
9 | Generering af træningsdata til andre AI-modeller |
10 | Oprettelse af tilpassede avatarer eller virtuelle assistenter |
11 | Simulering af sportshændelser eller konkurrencer |
12 | Produktion af musikvideoer eller koncertoptagelser |
13 | Design af arkitektoniske eller indretningsvisualiseringer |
14 | Skabelse af virtuelle modeshows eller produktpræsentationer |
15 | Generering af realistiske baggrunde eller landskaber til fotografering |
16 | Oprettelse af visuelle effekter til film eller teater |
17 | Simulering af vejrforhold eller naturkatastrofer |
18 | Visualisering af historiske begivenheder eller perioder |
19 | Produktion af animerede tutorials eller vejledninger |
20 | Skabelse af virtuelle nyhedsudsendelser eller rapporter |
21 | Design af interaktive kort eller geografiske visualiseringer |
22 | Generering af kunstværker eller kreative projekter |
23 | Simulering af medicinske procedurer eller sundhedsscenarioer |
24 | Oprettelse af virtuelle virkelighedsoplevelser |
25 | Produktion af animerede memes eller sociale medieindhold |
26 | Skabelse af virtuelle konferencer eller møder |
27 | Design af 3D-modeller til print eller fremstilling |
28 | Generering af realistiske dyre- eller vildtscener |
29 | Skabelse af animerede børnebøger eller læringsværktøjer |
30 | Simulering af rummissioner eller astronomiske begivenheder |
Bemærk venligst, at nogle af disse anvendelser kan kræve yderligere udvikling, ekstra moduler eller tilpasning af SORA-modellen. Desuden skal alle anvendelser overholde OpenAI’s brugspolitik og etiske retningslinjer.
Et kommende område vil være AI avatarer som er vellignende personer der er skabt fra et enkelt foto. Når det foto er taget kan det blive til bevægelse og synkronisering af det sagte. Der vil minimum være samme antal sprog som i CHATGPT.
Dette bruges til at fortælle om virksomheder m.v. Her vil detaljerigdommen formentligt være større med SORA også fordi de nuværende leverandører er begrænset til overdele af kroppen og kun nogle få har fået arme og hænder med som jo retorisk både giver en bedre forståelse og helhedsindtryk. Men her kan man selve komme gående ind og du kan vælge stort alle de filer du vil. På den måde vil f.eks. undervisnings- og kursusvideomarkedet komme med som omdrejningspunkt.
Når du oploader f.eks. 1 video kan denne flettes eller morphes sammen med en anden, eller den anden video kan være en scene i din første video.
Videoer i en video er ikke set før. Du har f.eks. en Video af Mallorca men vil også lige have en video af dine seneste tivoli besøg, så blandet disse universer, men i 3D så du kan flyve rundt om dine videoer og de SORA skabte miljøer som var du en drone… og kan interagerer med ydre input f.eks. til videnskabelige oplevelser og molekyler, til gaming, eller til skabelse af et enormt univers, der åbner for helt nye interaktioner.
Det geniale er at med dine SORA modeller kan genanvendes eller du kan skifte stedet optagelserne finder sted, baggrunde, miljøer og årstid og tidspunkt, f.eks. kan man male med objekter som i ZBRUSH, jeg ellers holder meget af.
Blanding af flere medier, f.eks. fotos, video-i-video m.v. Så den virkelige opdagelse hos OpenAI ser ud til at være en 3D digitalisering af videoer og fotos. For dem der ikke kender Shutterstock, så er det verdens største leverandør af slagsen, vi bruger godt selv stockdata fra adobe.com men det er entydtigt at Shutterstock er større.
Forestil dig lige dette på din hjemmeside f.eks. vores 1.000M2 kontorer, blandet i en model af vores droneoptagelser, på den måde kan besøge vores kontorer og se hvad der hænger på væggene eller se hvilke økologisk kaffe vi drikker i kantinen. Og man kan skifte til flere lokationer og se alting der inklusive medarbejderne i 3D. Du kan flyve rundt om mens de tegner f.eks. en model af en APP vi gerne vil sælge til dig.
Det halter dog med ordentlig lyd i forhold til karakterne og afstanden til det der lave lyden. Ligeså synkroniseringer og rigtig øjenkontakt mellem objekterne.
En anden ting vi kender fra ChatGPT er at nogle af objekterne pludslig kan for flere fingre eller potter. Når man ser på kattevideon i en seng får den pludslig 3 forpoter.
Udfordringer og Etiske Betragtninger
Mens SORA repræsenterer et stort skridt fremad for AI-teknologi, rejser dens udvikling også vigtige etiske spørgsmål. Det er afgørende, at der tages højde for potentielle risici, herunder spørgsmål om privatliv, sikkerhed og den bredere indvirkning på arbejdsmarkedet.
Der er dog nogle ret begrænsende filmmæssige skavanker, folk kan ikke kigge hinanden i øjnene. Det er endnu ukendt hvad man skal skrive, men ellers vælger man bare et andet objekt. Mange videoer med øjne virker som blinde mennesker. F.eks. 2 der går forbi hinanden eller vinker ser ikke hinanden i øjnene, ej heller kan de interagerer særligt korrekt, det gør som tomme personer eller dyr for den sags skyld er uden “kontakt” med hinanden. Folk kigger tomt rundt. 2 der lige møder hinanden ændrer jo karakter og hilser eller bukker lidt, det findes ikke lige med mindre man skriver det og så kan scriptet blive meget langt.
PSYKOLOGISKE PÅVIRKNINGER OG SKADER
Deepfakes og misbrug vil givetvis finde sted, men med ChatGPT’s begrænsninger så tror jeg man slipper for dette. Der er også et andet problem, vi kender fra CHATGPT, og det er at der skabes falske nyheder f.eks. at man har fundet gigantskelletter, nye fund under jorden, i vandet oy alt dette benyttes fligtigt af dem der lever af antal interaktioner. For et år siden lavede jeg for sjov et kæmpeskelet som jeg sagde min farfar fandt for 200 år siden, og 2 jeg kender godt faldt for dette, og spurgte om min farfar var arkæolog. Når noget lave i spøg men bliver opfattet som virkelighed, ja så er min tiltro til folkets skelneevne meget lille.
- En AI Genereret mærkningsordning kunne dog komme den slags til livs.
Dertil kommer de psykologiske perspektiver, hvordan vil al AI påvirke vores dømmesans, når de fleste poster med flest likes omhandler løgne og falske udsagn?
Der er bare som om at alle er ligeglade med at se falske nyheder, her burde der være et sandhedsfilter fra 1-10 hvor 10 er bekræftelser et nyhedsmedie med rigtige journalister, for det vi ser nu, er jo et misbrug for at skaffe likes og dermed indtjening på løgnehistorier.
Hver dag på Facebook er fyldt med videnskabelige fund der aldrig er fundet. F.eks. så tror 80% af alle mennesker nu, at disse giganter en gang har haft sin gang på jord.
OpenAI er opmærksomme på disse bekymringer og arbejder aktivt for at sikre, at SORA og lignende teknologier udvikles med ansvarlighed og gennemsigtighed.
Fremtiden med SORA
Sora er disruptiv, det vil sige det varsler at videobranchen forandres for altid. Det er lige pludslig nemt at lave reklamer, undervisningsvideoer og sjove videoer. Du skriver bare teksten og vupti 3 min. efter har du en video, der formentligt er unik.
Med lanceringen af SORA står vi over for en ny æra inden for kunstig intelligens. Dens avancerede egenskaber lover at revolutionere en række industrier, fra sundhedsvæsenet til finansverdenen, og dens potentiale er kun lige begyndt at blive udforsket.
Som med enhver ny teknologi, vil det være afgørende at navigere i dens udvikling med forsigtighed og overvejelse for de etiske implikationer. Men med den rette tilgang, kunne SORA være nøglen til at låse op for utrolige nye muligheder for menneskeheden, hvis man skal sige noget, men fakta kan meget vel være massearbejdsløshed.
I de hjerterlige gode gamle dage troede man at alle stadioner ville være tomme når nu TV transmitterede f.eks. en fodbold kamp. Vi ved nu godt at det ikke skette, tværtimod.
AI UDVIKLING OG VIDEOSTREAMING
Agil Udvikling A/S tilbyder allerede lavet Wowza videostreaming, efterbehandling med tekstning, lydsiden, talesiden og implementering af dit logo samt rulletekster m.v. Dette håndteres ikke pt. udover at selve tekstmotoren er genial, hvorimod f.eks. CHATGPT slet ikke kan producere grafiske eller billedlige tekster, da ChatGPT endnu fejler her. Og så skal man heller ikke bruge ordet IKKE her. Det virker ikke, skriver man ikke kommer der sommetider det med man IKKE vil ha. Sådan er det ALTID i ChatGPT.
Hvornår OG HVORDAN kan jeg få SORA?
Det er vigtigt at bemærke, at SORA endnu ikke er tilgængelig for offentligheden. Den er i øjeblikket i en “red-teaming” fase, hvor den bliver testet for at sikre, at den ikke producerer skadeligt eller upassende indhold.
Der er få betatestere, og leveringen sker kun fra OPENAI, hvis man er større artist, filmmager eller i reklamebranchen. Og så er den tilgængelig i Microsoft Azure Cloud miljøet snart, det vil sige under Microsoft Movie tror jeg navnet vil være, ligesom vi har Microsoft Designer nu.
OpenAI har allerede givet adgang til en udvalgt gruppe af visuelle kunstnere, designere og filmskabere for at få feedback om, hvordan modellen kan forbedres til at være mest nyttig for kreative professionelle. Alle andre må vente til slut marts.
Når SORA bliver offentligt tilgængelig, ( FORVENTES 30.MARTS ) vil du kunne bruge den ved at følge disse trin:
Adgang til SORA’s tekst-til-video-interface: Når SORA er frigivet, vil brugerne få adgang til dens interface via en OpenAI-websted eller -applikationen via Microsoft Azure. Vi forventer dog at selve kommanden “lav video” også kan ske direkte i ChatGPT på et tidspunkt.
Indtast en tekstprompt: En tekstboks vil tillade indtastning af en detaljeret tekstbeskrivelse af den video, du ønsker, at SORA skal generere. F.EKS. lav en sjov film om en elbil der løber tør for strøm og bruger en cykel til at lade den op igen.
Hvad kan SORA ikke?
Sora har allerede filtre som i det store hele ventes at følge politikken for CHATGPT, det vil sige, at man ikke f.eks. kan lave skabe portrætter af nulevende, og det ventes at følge en 70 års copyright, som jo slet ikke respekteres i CHATGPT, men alene som input til at generere unikke videoer på basis af mange stile, dermed bliver de mange copyright blandede, så der ikke er entydige copyright overtrædelser. Det virker nu hvis du oploader billeder af kendte, men det forsvinder snart.
Man vil ikkke kunne lave f.eks. en video om Mette Frederiksen, men f.eks. fint kan der sammensættes roller af det mest kendte f.eks. Freud i samtale med Johan Sebatian Bach mens de ser på Præsident George Washintons der sidder og spiller på violin, men man kan faktisk gpdt lave så det ligner med nutidige om man er heldig, man kan nemligt sagten skrive f.eks. en Elon Musk lignende person.
Indstil yderligere videoparametre. Disse er omfattende centreret om videografisk udtryk f.eks. kan man ændre kodning ala Davinci softwaren vi altid bruger til farvegraduering. Kender du ikke så download denne, det er verdens førende og ovenikøbet gratis. Også tekster og særlige inputs der forventes at være virksomme via de til den tid gældende API’ere, for her er det spændende med priserne, da man f.eks. til den tid kan lave sin egen APP med SORA som motor.
Generer videoen. Hastigheden er blændende hurtig, men forventes nok at falde når det store publikum kommer til. Dog er det ikke nogen nyhed at f.eks. store film er op til en uge om at blive genereret. Men eftersom grænsen nu er 1 minut tager generatoren ca. 2-5 minutter. Der er altså tale om video med lyd, animationer og morphing m.v.
Forhåndsvis og finjuster videoen. Man kan tilføje en 16xSampling der giver et unikt ekstra udtryk hvorimod 1x viser en grov kluntet version af det man vil vise, men godt ok til at man får et overblik over handlingen i videon.
Download den endelige SORA video. Videoen er i blændende god kvalitet, og det er som om man får adgang til al den viden CHATGPT har og kan lave video over dette. F.eks. prøvede vi at lave en video om en berømt historie og Kong Arthur og det runde bord hvor alle detaljer helt ned til regalia m.v. var flotte selv ved zoom nogle gange. En anden var 2 riddere i fuld rustning i snevejr der lavede sjov.
Indtil da kan du se nogle demoer af SORA i aktion på OpenAI’s hjemmeside og især her hvor alle de bedste er samlet: Husk, at denne information kan ændre sig, når SORA bliver offentligt tilgængelig. Der er et par ekstra facilitter og filtre der kommer i den endelige udgave.
SORA Konklusion
Men samlet set må jeg sige at det er imponerende i sin enkelthed, og billedsiden er som frygtet ikke dårlig, men nærmest ægte i sin farvegraduering i modsætning til f.eks. ChatGPT og mange APPS herunder, der laver VIDID, altså et stærke farveudtryk på billeder, så min værste frygt er forstummet. Det er ikke alene genialt, det er autentisk og derfor virker det som ægte videooptagelser.
Dog kan man se hvis man f.eks. har 2 personer i spil at de ikke interagerer f.eks. kigger på hinanden når de gør noget, hvilket kan give et indtryk af computergenerering. F.eks. i løb eller ved at gå imod publikum… dette skal instrueres.
Det kræver dog sin person M/K, at skrive teksterne så de rent faktisk kommer til at vide den idé som man har. Og man kommer til at løbende justere sit input, 20-30 gange for mig for hver video.
Standard længden er på 1 minut, og dermed er der mange grænser, man vil dog kunne komme til at kunne tilkøbe, så jeg tror dette år er premiereåret for de første kortfilm og længere film der er lavet alene med SORA.
Som Videoproduktionsredskab er 1 minut dog perfekt til f.eks. reklamer, sociale medier, hjemmesider og f.eks. inde i Powerpoint præsentationer m.v. Jeg forudser markedet oversvømmet med Sora Videoer her i marts, både Facebook, Tiktok, LinkedIn, X og mange flere…
Jeg glæder mig til at se prislisten og copyright vilkår.
Samlet vurdering af OPENAI SORA: 9 ud af 10.
Du kan se de bedste videoer med SORA her: https://twitter.com/videossora
Kilde: Agil Udvikling A/S, Michael Rasmussen mailto:mr@agiludvikling.dk
Fotokredit: SORA webdesign fra den preliminære hjemmeside hvor alle video kan ses.
Ⓒ 2024 Copyright by AI UDVIKLING – kan deles frit ved link til denne artikel.