TECH
”Utse inte ai-vinnare och förlorare än”

PERSPEKTIV. En rasande snabb och imponerande utveckling får många att spekulera i tänkbara vinnare och förlorare. Men det finns mer spännande frågor som väntar på svar – inte bara om enstaka snedseglingar, skriver Ny Tekniks Anders Thoresson.
"Jag häpnar över ai-nyheter - varje vecka." Det var rubriken på min senaste text i Ny Teknik, publicerad den 20 november.
Sen gick det tio dygn och så var tidsskalan förändrad. I stället för att häpna varje vecka häpnade jag plötsligt varje dag.
Behöver du påminnas om vad som hände den 30 november?
Längre än så är det inte sedan Open AI släppte sin chattspecialiserade ai-modell Chat GPT. Sannolikheten är hög för att ni som läser själva har experimenterat eller åtminstone sett en uppsjö exempel av vad Chat GPT klarar – och var den kör i diket.
För det är ju där modellen står i dag. Med en fantastisk förmåga att hålla igång en chattkonversation. Men också en ibland förbluffande oförmåga att producera text som faktamässigt är korrekt.

Som när jag tar rollen som en utländsk turist som gärna vill besöka en ö mellan Grebbestad och Strömstad och låter Chat GPT agera resesäljare. Förväntar mig Koster som förslag, får tillbaka Hönö. Påpekar felet, att en ö utanför Göteborg knappast passar mitt önskemål, och får då en lista med Orust, Tjörn och Käringön – alla med precisa riktningar från Grebbestad räknat. Norrut, nordväst, norrut. Bohuslänningen i mig fnissar så klart till, medan teknikjournalisten börjar fundera på hur till och med så otvetydiga faktauppgifter kan bli så totalt fel.
I svallvågorna av alla Chat GPT-exempel som spridits i både sociala och traditionella medier har en lång rad ”hot takes” följt.
En återkommer oftare än andra: ” Det här kommer att skaka om Googles position som den dominerande sökmotorn på nätet.”
Men det är ju inte så att Google ligger på latsidan, direkt. I en nystartad serie blogginlägg lovar företaget att presentera sina genombrott så här långt och vad som väntar 2023. Den första texten staplar exempel på varandra.
Jag tror att det är alldeles för tidigt att dra några som helst slutsatser om vilka eventuella maktbalanser som generativa ai-modeller.
Utvecklingen av språkmodeller sker på flera håll. Ett annat exempel, som inte alls fått lika stor uppmärksamhet som Chat GPT, är Metas Cicero. Det är en modell byggd att excellera i Diplomacy, ett brädspel som påminner lite om Risk. Med en i sammanhanget viktig och avgörande skillnad. I stället för tärningsslag och tur är det hemliga förhandlingar mellan spelarna som avgör vem som till slut vinner.
Och här lyckades Cicero i höstas utmanövrera mänskliga spelar, vilket är en framgång som bland annat kräver förmåga att förhandla med och se igenom motståndarnas strategier. Det är genskaper som också behövs för andra former av samarbete och interaktion. Och hos Hugging Face publiceras öppna ai-modeller fritt tillgängligt.
Jag tror att det är alldeles för tidigt att dra några som helst slutsatser om vilka eventuella maktbalanser som generativa ai-modeller – det vill säga modeller som kan skapa mänskligt språk, ljud, video, bilder – kommer att påverka. Jag påminner igen: Chat GPT har vi bara haft möjlighet att leka med i knappt två månader. Den underliggande modellen GPT-3.5, som i sin är en vidareutveckling av GPT-3 som tog världen med storm sommaren 2020. Så "ny" eller "gammal" beroende på vilken måttstock du använder.

Så vi höjer blicken. I stället för att specifikt fundera på vad de modeller vi har här och nu kan gör vi ett försök att följa tangentens riktning in i framtiden.
Då ser vi en mängd frågor som väntar på svar – om både möjligheter och utmaningar.
Några av dem:
1. Att formulera sökningar på nätet som frågor kommer naturligt för många av oss. Gör du det inte själv har du säkert sett en kollega eller en släkting knappa in en fullständig fråga, komplett med frågetecken på slutet, i en sökruta på nätet. Vad kommer tjänster byggda för att hantera en mänsklig dialog innebära för informationssökning på nätet? Blir det mer lättillgängligt, kommer det hjälpa fler att hitta den information de faktiskt letar efter?
2. När kommer ett chattgränssnitt vara rätt – och när passar faktiskt den nuvarande paradigmen bättre?
3. Hur bygger man ett användargränssnitt för en ai-modell som låter lika självsäker oavsett om svaret är mitt i prick eller inte ens träffar tavlan? Hur utbildar och påminner man användarna om vad produktens styrkor och svagheter är?
4. En tänkbar konsekvens av generativa ai-modeller är att mängden automatgenererat innehåll på nätet ökar mångfalt. Hur ska en söktjänst förhålla sig till det?
5. Vad kommer ai-modeller för konversationer i kombination med allt bättre modeller för syntetiska röster göra för utvecklingen av röstassistenter? I dag är det ju samtal som många gånger är minst sagt styltiga.
6. Det i särklass dominerande sättet för dagens sökmotorer att tjäna pengar är på annonser. Men hur kapitaliserar man på informationssökning som sker i chattformat?
7. Hur kommer lagstiftare runt om i världen förhålla sig till frågor som rör upphovsrätt och träningsdata för de här modellerna?
8. Och så den sista frågan, en som jag rent personligen är väldigt nyfiken på: Vem blir först med att bygga en riktigt bra slutanvändarlösning med ett chattgränssnitt liknande Chat GPT men som i första hand hämtar sina svar från min egen dokumentsamling?
På min hårddisk har jag drygt 20 års samlade artiklar, researchanteckningar, utskrivna intervjuer. Det är en textmängd jag gärna skulle interagera med på sätt som gräver fram mer kunskap och insikter än vad enkla nyckelordssökningar levererar.
Som avslutning en påminnelse. Det är viktigt att skilja på vad som är produkt och vad som är underliggande teknik. Att Chat GPT till stor del bygger på en modell som funnits tillgänglig i drygt två år visar tydligt hur viktig förpackningen och leveransen av teknik är.
Den som på sikt blir vinnare är inte nödvändigtvis den som har bästa tekniken.
Det är den som har bästa produkten.
Anders Thoresson är teknikjournalist och medverkar regelbundet i Ny Teknik. Han är också medarbetare vid AI Sweden.