Dall-E mini tar nätet med storm – men vad är det?

2022-07-01 11:58  

Med Dall-E 2 och Imagen började människor jorden runt skapa realistiska bilder och konst baserat på ord och enkla fraser. Sedan tog Dall E-mini över.

Först kom Open ais Dall-E 2. Sedan Googles Imagen (som har utgått från Open ais öppna källkod). Vad handlar det om? Jo, bildgeneratorer baserade på ai. Allt som krävs av användaren är att hen skriver in några ord eller enklare fraser. Resultatet blir en detaljerad bild eller ett konstverk. Men finns en begränsning med verktygen, som, som Dall-E mini råder bot på.

Vad är Dall-E mini?

Trots namnet är det inte en uppfinning från Open ai, utan en ny ai-baserad bildgenerator skapad av mjukvaruutvecklaren Boris Daymas med inspiration av Dall-E 2. Till skillnad från konkurrenterna har han sett till att göra verktyget fritt tillgängligt och gratis för alla. Dall-E mini har blivit en viral succé.

Läs mer: AI-skapade bilder tar nätet med storm: ”Djupt imponerande”

Är det lika bra då?

Kvaliteten på bilderna som Dall-E mini genererar är inte lika hög som de andra. Ansikten kan se suddiga, förvrängda och nästan läbbiga ut. 

– Bilden är kodad i en väldigt kort nummersekvens så att modellen kan lära sig snabbare. Det här gör att modellen gör många fel. Men du kan rita månen, ett landskap eller ett träd utan att märka några konstigheter, säger Boris Dayma till BBC Science Focus.

Foto: Dalle-E mini

Foto: Dalle-E mini

Han menar att modellen egentligen är lika bra eller dålig på alla slags bilder, men att vi lägger mycket mer tyngd på hur ett ansikte blir, till exempel om en näsa är sned eller ögonen sitter fel.

Genom att skriva långa och mer detaljerade kommandon över sådant som var och hur stora delarna av ansiktet ska vara har användare dock lyckats kommit runt problemet.

Kan du få bilder på vad som helst?

Verktyget har inga begränsningar sett till vad du kan be det att skapa, på gott och ont. BBC Science Focus förklarar att man till exempel kan använda Dall-E mini för att få en bild av kända seriekaraktärer som pratar under ett Ted Talk, men också för att få fram rasistiska eller våldsamma bilder. Dall-E mini har inget säkerhetsprotokoll på plats, vilket det finns för Imagen och Dall-E 2.

Foto: Dalle-E mini

Foto: Dalle-E mini

Vad blir det för bilder då?

När Boris Dayma vill se vad folk har gjort med hans verktyg brukar han scrolla på Twitter. Han är särskilt förtjust i termen ”trail cam”, som ger korniga bilder som tycks ha tagits nattetid med en kamera med låg upplösning. Det som har imponerat mest på honom är användarnas kreativa ådra. 

– Jag kunde skriva in något som en vy från en sjö under månsken, eller Eiffeltornet på månen och det var mina mest komplexa kommandon. Men när jag ser vad folk använder det här till blir jag förundrad. Jag har inte den här nivån av kreativitet och användarna lär sig att vrida på modellen för att skapa riktigt specifika kommandon som jag aldrig skulle ha kommit på, säger han till BBC Science Focus.

Nyfiken på att testa? Här hittar du Dalle-E mini.

Ania Obminska

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

  Kommentarer

Debatt

Läs mer