TECH

Googles nya musik-ai imponerar – men ingen får använda tjänsten

Skylt utanför Googles kontor i San Francisco. Arkivbild. Foto: TT-Bild

Google är på offensiven mot Open Ai och Chat GPT. Sökjättens nya ai-verktyg kan skapa musik i alla genrer – utifrån en kort text.

Publicerad Uppdaterad

Intresset för ChatGPT är och har varit explosionsartat sedan lanseringen i fjol. Nu har Open AI:s ai-verktyg fått en utmanare – den här gången från Google.

”Iphone-ögonblick” för ai-eran – Nvidia stöttar svensk superdator

Den här gången handlar det inte om att utifrån korta prompt-texter generera text (som ChatGPT) eller bild (som Dall-E eller Stable Diffusion).

Rymd-reggaeton imponerar

Googles nya ai-verktyg fokuserar på en annan konstform: Musik i alla inriktningar man kan tänka sig. Verktyget MusicLM visar på en stor bredd, och kan bland annat kombinera genrer och instrument med oväntade resultat. En annan sak som är imponerande är att verktyget kan skapa musik utifrån långa och ibland vaga eller abstrakta beskrivningar, som denna:

"A fusion of reggaeton and electronic dance music, with a spacey, otherworldly sound. Induces the experience of being lost in space, and the music would be designed to evoke a sense of wonder and awe, while being danceable".

Tränats med 280 000 timmars musik

MusicLM, eller music language model, är inte det första ai-verktyget som kan generera musik – Googles egna AudioML eller Jukeboxe från Chat GPT-skaparna Open AI är två tidigare exempel. Men det nya verktyget visar tydligt hur snabb utvecklingen är inom den här typen av ai-modeller, som numera kan användas till att skriva uppsatser, felsöka kod – och skapa musik.

Enligt Google forskare utgörs kärnan i det nya nätverket av en equence-to-sequence-modell (även kallad seq2seq). Verktyget har tränats med i form av bland annat 280 000 timmars musik, och kan skapa låtar som är flera minuter långa, med en kontinuerlig samplingsfrekvens på 24 kHz.

Hajpade Chat GPT klarade juridiktenta

Till skillnad från Open AI:s Chat GPT kommer Google inte att släppa sitt nya verktyg till allmänheten – på grund av rättighetsskäl knuten till musiken, skriver Engadget.

Alla talar om Chat GPT och transformers

Den stora framgången för konversationsboten ChatGPT har skapat ett gigantiskt intresse för språkmodeller och nya typer av ai-verktyg. Microsoft meddelade nyligen att man investerar ett mångmiljardbelopp i Open AI, som skapat både ChatGPT och Dall-E 2.

Chat GPT kan utifrån enkla direktiv skriva långa texter. Här uppmanas den till exempel att skriva en uppsats som förklarar bakgrunden till Kalla kriget. Arkivbild.

Investeringen ses som en viktig strategisk satsning för mjukvarujätten. Företaget sägs ha planer på att bygga in ai-tekniken i bland annat Microsoft Office samt sökmotorn Bing. Det sistnämnda har fått folk att spekulera i att Open AI:s ai-teknik kan utgöra ett framtida hot mot Google, vars sökmotor dominerar totalt i dag.

Preventivappen Natural Cycles och tech-ringen Oura – så fungerar samarbetet

Google är inte oberört av intresset för Chat GPT. Sökjätten publicerade nyligen ett långt dokument där bolaget utförligt redogör för sin mångåriga forskning inom artificiell intelligens – forskning som bland annat ligger till grund för så kallade transformermodeller.

Googles sökmotor hotad?

Det är en djupinlärningsmodell som exempelvis ChatGPT använder för att bli bättre på att förstå innebörden i frågorna som människor ställer till ai-verktyget. Detta genom att titta på alla delar av texten för att kunna skapa ett sammanhang. Google använder redan i dag språkmodeller med tranformerarkitektur i sin kärnverksamhet, exempelvis ramverket Bert som ska göra det enklare för teknikjättens sökmotor att analysera och begripa människors stundtals vaga sökningar.

Nu återstår det att se vilket Googles, Open AI:s och resten av branschens nästa steg blir – och vilken konstform som är i fokus för kommande ai-verktyg.