TECH

Kvaliteten på Open AI:s nya videoskapare får internet att häpna

Stillbild från video genererad med enbart textinstruktioner. Open AI kallar sin videoskapare Sora.

Open AI är inte först med att ta fram en ai-modell som kan göra video av textinstruktioner. Men Sora blev omgående en sensation när Chat GPT presenterade den på torsdagkvällen.

Publicerad Senast uppdaterad

Med Sora kan användare generera videor som varar upp till en minut – betydligt längre än vad många av Open AI:s rivaler mäktar med. Sociala medier fylldes snabbt med exempel som bland annat visar realistiska närbilder på ansikten, vidsträckta panoraman av historiska platser, ”dokumentärt” foto av mammutar som pulsar i snön och lekfulla animationer.

”Sora kan”, skriver Open AI, “generera komplexa scener med flera karaktärer, specifika typer av rörelse och korrekta detaljer av subjekt och bakgrund. Modellen förstår inte bara vad användaren har frågat efter i en prompt, utan också hur de sakerna fungerar i den fysiska världen”.

Open AI skriver vidare att “Sora kan skapa flera tagningar i en enda genererad video där karaktärer och visuell stil består” mellan tagningarna.

Men den har också tillkortakommanden och kan ha svårt att simulera fysik i en komplicerad scen och kanske inte begriper orsak och verkan. ”En person kanske tar en bit av en kaka men efteråt är kakan intakt”, uppger Open AI. ”Den kan också bli förvirrad av rumsliga instruktioner som skillnaden mellan höger och vänster.”

Likväl är reaktionerna än så länge översvallande.

”Otroligt”. ”Kvaliteten är helt vansinnig.” “Sora-videorna har gjort mig mållös. Det här är fantastiskt och kommer att förändra allt.” Det är några omdömen på X (före detta Twitter).

Open AI har inte släppt Sora i en version för publik användning än så länge. Den säkerhetstestas för tillfället. Däremot har ett antal filmskapare och designer fått tidig tillgång till modellen.

✉️ Språk- eller faktafel i texten? Skriv och berätta.