TECH

Guide: Ai-verktygen som kan ge ditt jobb en boost

Den här människan existerar inte. Bilden är genererad av ai-verktyget Midjourney.
Den här människan existerar inte. Bilden är genererad av ai-verktyget Midjourney.

Språkmodeller och generativ artificiell intelligens har lett till en explosion av nya tjänster och verktyg – och fler lär det bli. Här presenterar vi undan för undan de mest spännande satsningarna. Först ut är sju ai-verktyg som på olika sätt visar vad som är möjligt med tekniken.

Publicerad Uppdaterad

Vid sidan om de motorvägar där giganter som Open AI, Microsoft och Google dånar fram i allt högre hastighet myllrar det av ai-startupbolag som på ett eller annat sätt använder generativ teknik och språkmodeller. För var dag som går tycks de föröka sig exponentiellt och det börjar redan bli omöjligt att överblicka allt som sker.

På det här utrymmet tänker vi presentera en lista över ai-startupbolag och andra aktörer som fångat vårt intresse – och vi tänker fylla på den allt eftersom. Kanske kan deras tjänster eller verktyg ge inspiration eller vara till nytta i din vardag eller i din yrkesroll.

Chattboten Claude finns bland annat integrerad i appen Poe.
Chattboten Claude finns bland annat integrerad i appen Poe.

Claude: Chattbot

Startupbolaget Anthropic lanserade i mars 2023 chattboten Claude. Anthropic är grundat av före detta medarbetare på Open AI. Något som gör att företaget sticker ut i mängden är att de så explicit är tydliga med att de förstår det så kallade alignment- eller kontrollproblemet. Alltså hur man ska säkerställa at ai – både nu, men i synnerhet om den når generell intelligens – har mål som inte avviker från mänsklighetens.

Claude sägs därför vara mindre benägen att generera rasistiskt eller sexistiskt innehåll, tenderar att hallucinera mindre och sägs undvika att ge råd om sånt som exempelvis illegal verksamhet. För att lyckas med detta har Anthropic byggt ett ramverk de kallar ”konstitutionell ai”, där Claude ska rätta sig efter ett antal fastställda principer.

Under betafasen visade det sig dock att inte ens Claude helt och hållet kan följa de mål Anthropic försett chattboten med. En testanvändare fick till exempel instruktioner om hur man går tillväga för att tillverka metamfetamin hemma.

Likväl har företagen bakom verktyg och plattformar som Notion, Quora och Duckduckgo införlivat Anthropics ai i sina produkter. Och Google har investerat 300 miljoner dollar i startupbolaget.

ACT-1: Kan agera på internet

Adept är ett företag att hålla ögonen på. För det första har grundarna expertis från Google och Open AI. För det andra ligger två av dem – Ashish Vaswani and Niki Parmar – bakom den vetenskapliga artikel som ledde fram till de senaste årens exempellösa ai-genombrott. Artikeln med rubriken ”Attention is all you need” från 2017 beskrev en transformerarkitektur med en attention/uppmärksamhetsmetod (som vi skrivit betydligt mer om här).

För det tredje? Jo, Adept vill inte bara att artificiell intelligens ska kunna läsa och skriva, utan också kunna agera på internet. Deras första modell, ACT-1 (action transformer-1), fungerar som ett plugin till webbläsaren Chrome som kan klicka, skriva och scrolla. I sinom tid föreställer sig Adept att vi inte knappar in det vi är ute efter på nätet – utan överlåter det uppdraget till vår chattbot, genom att tala med den.

Det här är naturligtvis ingen nyss påkommen idé och vi serverades samma löften när röstassistenter i smarta högtalare var populära. Men som alla noterat är dagens ai-modeller väldigt mycket mer kraftfulla och kapabla.

Gen-2: Video-till-video

Gen-2.
Gen-2.

Stable Diffusion är tillsammans med Midjourney och Dall-e den mest kända text-till-bild-generatorn. Nu har företaget bakom Stable Diffusion, Runway, släppt Gen-2. Det är en video-till-video-generator.

Användaren kan ta en befintlig video och förvandla den bara genom att med text beskriva sitt önskemål. Filter, masker och annat kan adderas genom att via text och/eller bild beskriva det resultat man är ute efter.

Harvey AI: Juridisk hjälpreda

En ai-modell som bygger på GPT-4, anpassad för juridik. Allen & Overy, en av Englands största advokatbyråer, har betatestat Harvey sedan november 2022. Omkring 3 500 av deras medarbetare ställde runt 40 000 frågor till Harvey under testfasen, om allt från kontraktsanalys, företagsbesiktning och efterlevnad av regulation.

Allen & Overy menar att Harvey utifrån stora volymer data kommer att kunna generera insikter, rekommendationer och förutsägelser, som granskas av en mänsklig advokat.

– Jag har aldrig sett något som Harvey tidigare…den är en game-changer som kan släppa lös kraften i generativ ai för att omvandla vår industri…under vårt test såg vi en del fantastiska resultat, säger David Wakeling, chef för marknadsinnovation på Allen & Overy, i ett pressmeddelande.

Macwhisper: Transskribering

Att transskribera tal till text är för många journalister och forskare ett arbete som tar mycket tid i anspråk. På senare år har en rad ai-lösningar dykt upp som haft det gemensamt att de inte har varit särskilt bra. Macwhisper är dock ett steg i rätt riktning. Det bygger på Open AI:s transformerbaserade tal-till-text-modell Whisper.

Ny Teknik serverade Macwhisper en timmes intervju på svenska med dålig ljudkvalitet och det fungerade överraskande bra. Dessutom betalar man en engångssumma för verktyget och transskriberingen sker lokalt på datorn.

Ett alternativ om man inte använder en Mac-dator – som också bygger på Whisper – är danska Good Tape.

Midjourney: Text-till-bild

Genererat innehåll i form av illustrationer och bilder förknippas ofta med Open AI:s Dall-e. Frågan är dock om inte konkurrenten Midjourney – när det här skrivs i mars 2023 åtminstone – är vassast. Version 5 av deras ai-modell kan generera bilder så realistiska att det är snudd på omöjligt att avgöra om de är verkliga eller inte.

Skapa videor med hjälp av bara text.
Skapa videor med hjälp av bara text.

Synthesia: Text-till-video

Addera text. Ut kommer en video med en påfallande människolik avatar. Videon kan designas med olika typer av visuella formspråk, egna logotyper och bakgrundsmusik. Ny Teknik har testat att generera en kort videosnutt på svenska, men där lämnar Synthesia fortfarande en del att önska.