Googles ai har knäckt 50-årig proteingåta: ”Ett genombrott”

2020-12-02 10:22  

Deepminds algoritm kan lista ut hur ett proteins struktur kommer att se ut. Ett arbete som kan ta månader eller år i labbet. "Ett genombrott" som bland annat kan skynda på utvecklingen av nya läkemedel, säger kemiprofessor Pernilla Wittung Stafshede.

I 50 år har forskarvärlden jobbat med att kartlägga hur proteinmolekyler viks ihop till en tredimensionell form, en process som kallas för proteinveckning. Att förstå hur en proteinstruktur ser ut kan i dag kräva månader eller år i labbet, men det Google-ägda ai-bolaget Deepmind har nu lyckats skapa simuleringar som i vissa fall är mer träffsäkra än manuella experiment.

– Det är helt nödvändigt att bestämma proteiners 3d-strukturer för att kunna förstå vad det har för olika funktioner, säger Pernilla Wittung-Stafshede som är professor vid avdelningen för kemisk biologi på Chalmers och har själv jobbat med proteinveckning i 25 år.

Ett protein är en lång kedja av aminosyror som sitter efter varandra på rad. Dessa kedjor kan veckas till otaliga former och strukturer. I teorin skulle ett genomsnittligt protein kunna anta någonstans i storleksordningen 10^300 olika former, men varje proteinkedja veckar sig alltid till samma slutstruktur: den med lägst energi.

Formen är avgörande för vilka egenskaper proteinet får. Därför är det ett stort steg att kunna titta på ett proteins aminosyrakedja och utifrån de uppgifterna förutsäga hur den funktionella 3d-strukturen kommer att se ut.

– Det här är ett spännande ögonblick för hela fältet. De här algoritmerna har blivit tillräckligt mogna och kraftfulla för att appliceras till verkliga vetenskapliga problem, säger Deepminds medgrundare och vd Demis Hassabis i en intervju med The Guardian.

Läs mer: Ai förutspår risken för hjärt-kärlsjukdom – lika bra som experterna

Algortimen mer träffsäker än experiment

Deepminds genombrott kom vid en tävling som anordnas vartannat år och kallas för Critical assessment of protein structure predicitions, CASP. Forskarlag som deltar får försöka förutse hur ett antal proteiner kommer att se ut i tredimensionell form, sedan jämförs deras prediktioner med resultat från experiment där strukturerna kontrolleras.

Resultatet bedöms på en hundragradig skala som kallas för Global Distans Test, GDT. Förra gången Deepmind deltog i CASP vann bolagets proteinalgoritm Alphafold tävlingen med ett median-GDT på runt 60. I årets upplaga låg Alphafolds medianvärde på GDT 92,4.

Vid den träffsäkerheten är felmarginalen enligt Deepmind mindre än en atoms tjocklek mellan modellen som visas i prediktionen och den verkliga strukturen.

– Det betyder att de fått bättre noggrannhet än vad man får genom experiment. Det blir alltid en felmarginal även vid experimentella strukturbestämningar, och nu blev Deepminds felmarginal mindre. Det är ett genombrott, säger Pernilla Wittung-Stafshede.

Läs mer: ”Dna-testet fick mig att djupandas i flera månader”

Snabbare läkemedelsutveckling

Algoritmer med så hög träffsäkerhet har många praktiska tillämpningsområden, inte minst inom läkemedelsindustrin. Pernilla Wittung-Stafshede menar exempelvis att det hade varit möjligt att mycket snabbt ta fram olika läkemedel mot covid-19 om en etablerad algoritm i stil med Alphafold funnits på plats.

– Hade en dator kunnat räkna ut hur coronavirusets proteiner ser ut och var man kan blockera dem, hade man inte behövt ta fram lika mycket data med hjälp av experiment, säger hon.

Deepminds algoritmer har tränats på data från en publik databas med över 170 000 proteinstrukturer som har tagits fram genom labbexperiment. Träningsprocessen för att ta fram den version av Alphafold som användes i tävlingen ska ha tagit ett fåtal veckor och körts på mellan 100 och 200 grafikprocessorer.

Mer detaljerad information om mjukvaran och dess prediktioner kommer att presenteras i en vetenskaplig rapport som troligen publiceras under nästa år.

Tillgången till träningsdata i form av proteinstrukturer från experiment har varit viktig för att Alphafold ska kunna nå så hög träffsäkerhet.

– Dilemmat är att det finns många proteiner som vi inte vet något om eftersom de är väldigt svåra att strukturbestämma genom experiment. De kommer att vara svåra att förutspå för datorn också eftersom det inte finns någon träningsdata, säger Pernilla Wittung-Stafshede.

Läs mer: Stanfords ai upptäcker de missade jordskalven

Utveckling på flera fronter

Men hon tillägger att det sker snabb teknikutveckling även på experimentsidan, bland annat via kryoelektronmikroskopi. Det är en metod vars upphovspersoner belönades med Nobelpriset i kemi 2017 och som nu kan utmana mer beprövade metoder som NMR eller kristallografi. I takt med att experimentella data blir bättre och fler protein strukturbestäms, kan också ai:n utvecklas och lära sig att förutspå fler typer av proteinstrukturer.

Samtidigt kan en bra och träffsäker ai-modell göra det möjligt att kartlägga svårbestämda proteinstrukturer i labbet genom att kombinera prediktion med experiment.

När tror du att teknik som den Deepmind utvecklat kan användas i praktiska syften?

– Jag tror att det fortfarande är lång tid innan vi kan förlita oss bara på ai för att ta reda på proteinets struktur. Då pratar vi många år för att första verifiera och visa att metoden håller för många olika typer av proteiner, säger Pernilla Wittung-Stafshede.

– Men i kombination med experiment blir ai en stark möjlighet. Du behöver inte göra lika många experiment när du kan använda ai, och det kommer att skynda på utvecklingen av vaccin och läkemedel och öka förståelsen för många sjukdomar.

Läs mer: Hopp om att en hostning i mobilen ska avslöja coronaviruset

Nu återstår nästa gåta

Även om Deepmind verkar vara på god väg att lösa ett 50-årigt problem inom proteinveckning återstår en annan, minst lika viktig gåta. Det är hur det går till när proteinets aminosyrakedja veckar ihop sig till sin unika tredimensionella struktur. En fråga så komplex att den har gett upphov till ett nu 52-årigt olöst problem: Levinthals paradox.

– Ai:n visar proteinets sluttillstånd, men inte hur det kommer dit. Ska man förstå hur livet är uppbyggt finns det mycket att lära sig om hur proteiner rör sig när de är i sina veckade tillstånd och hur själva vecklingsprocessen går till, säger Pernilla Wittung-Stafshede.

– Det finns miljoner sätt ett protein kan veckas på, skulle proteinet prova alla möjligheter skulle det ta för evigt, men proteinet veckas snabbt. Det måste finnas något som styr veckningsprocessen.

Deepmind Technologies

Det brittiska bolaget grundades 2010 och köptes fyra år senare upp av Google. I dag har företaget över 1 000 anställda.

Bolaget blev världsberömt efter att ai-modellen AlphaGo lyckades slå en av världens bästa mänskliga spelare i det kinesiska brädspelet Go, som dittills ansetts för komplext för datorer.

Företagets ai-modeller har i dag tillämpats i en rad funktioner både inom Google och hos tredje part. De har bland annat hjälp till att sänka energiförbrukningen i datacenter, skapa en bättre rekommendationsmotor i Google Play-butiken och skapat funktioner för att öka batteritiden på mobiltelefoner.

Simon Campanello

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

  Kommentarer

Debatt