Big data revolutionerar forskningen

2017-05-24 06:00  
Professor Erik Ingelsson kan studera miljontals genvariationer och ha upp emot en halv miljon försökspersoner tack vare big data och förbättrad teknik för genkartläggning. Foto: Daniel Roos

Inte bara näringslivets sätt att styra sin verksamhet förändras av big data. Även grundforskningen får helt nya förutsättningar.

Erik Ingelsson är professor i medicin vid Stanforduniversitetet i USA, där han och hans forskargrupp letar efter kopplingar mellan våra gener och risken att drabbas av hjärt- och kärlsjukdomar eller åldersdiabetes. Utvecklingen inom big data har helt förändrat förutsättningarna för forskningen.

– För 10–15 år sedan valde man ut en gen och analyserade några nedärvda variationer av dna-sekvensen i den genen. Det gick att göra med vanliga statistiska verktyg, eftersom det handlade om kanske tio variabler och max några tusen individer. Materialet var inte större än att en vanlig laptop kunde hantera det, säger Erik Ingelsson.

Men över det senaste decenniet har det skett en dubbel teknikutveckling. Den ena handlar om big data-verktygen. Den andra om möjligheterna att göra helgenomsekvenseringar, att kartlägga en individs hela arvsmassa inom rimlig tid och till en rimlig kostnad. I Erik Ingelssons forskningsfält har alltså tillgången till data växt enormt samtidigt som det finns verktyg att hantera dem.

– I de studier vi gör i dag studerar vi miljoner genvariationer, i stora material, ofta med över hundratusen, upp emot en halv miljon försökspersoner, säger han.

Tidigare försökte forskarna alltså ställa upp hypoteser om vilka gener som påverkade en viss egenskap. Hur stor chans är det att man träffar rätt?

– Inte så stor, eftersom man var begränsad av vad man redan kände till, men det var det bästa man hade. Så nej, det var inte särskilt lätt och man träffade inte rätt särskilt ofta. Vilket man också har kunnat se i större studier som försökt replikera resultaten: det har inte gått, eftersom teorierna om kan- didatgenerna oftast inte stämde.

Läs mer:

Läs mer: Gigantiska datamängder löser riktiga problem

För tio år sedan hade forskarna en hypotes – den här genen på- verkar den här sjukdomen. Men när ni tittar på hela det mänskliga genomet kan ni knappast ha en teori om vad ni letar efter?

– Inte på samma sätt som då. Och när vi började jobba på det här sättet var det många som kritiserade att vi inte hade en hypotes. Men forskarsamhället har i dag anammat det här arbetssättet.

– Men helt hypoteslöst är det ändå inte, forskning går inte att bedriva utan en hypotes. Men nu är den väldigt brett formulerad: vi tror att det finns genetisk variation någonstans i genomet som är kopplat till den här egenskapen.

Vad blir bättre för dig och dina kolleger tack vare de här nya möjligheterna?

– Vi kan hitta riktiga associationer mellan genetisk variation och sjukdomar och andra egenskaper, resultat som vi senare går vidare med i laboratoriet för att ta några kliv närmare ett färdigt läkemedel.

Så hypoteserna ni får fram i big data-körningarna går ni vidare med?

– Precis. När vi tittar på variationer över hela genomet hittar vi associationer mellan en viss region och en viss egenskap, som risk för hjärtinfarkt. Men i regionerna finns många olika gener, vilket innebär att vi inte vet vilken som påverkar sjukdomsrisken. För att hitta svaret på det jobbar vi vidare med flera olika metoder, för att slutligen hamna i labbet för att bekräfta hypotesen.

Så de hypoteser ni testar i dag är bättre, eftersom de inte är de bästa gissningar en forskare kan göra, utan framvaskade ur stora datamaterial?

– Ja, det är ett bra sätt att sammanfatta det på. Och man ser att många forskare inom till exempel molekylärbiologi plockar upp hypoteser ur de resultat som publiceras från big data-baserad forskning och går vidare med den.

Prenumerera på Ny Tekniks kostnadsfria nyhetsbrev!

Erik Ingelsson

Professor i medicin vid Stanforduniversitetet i USA, tidigare vid Uppsala universitet.

Våren 2015 var han en av fem som fick dela på Göran Gustafsson-priset, Sveriges största pris till unga forskare.

Hans forskning är inriktad på sambanden mellan genetik och risken att drabbas av hjärt- och kärlsjukdomar eller åldersdiabetes.

Anders Thoresson

Mer om: Big data Stanford

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

  Kommentarer

Debatt