Annons

Opinion

”Fler randomiserade tester hade lärt oss mer om pandemin”

Centre for Translational Microbiome Research (CTMR) på Karolinska institutet. Foto: Tobias Ohls

DEBATT. Att testa mycket är bra, men även att testa mer systematiskt. Det är förvånansvärt lite vi lärt oss på riktigt från data under pandemin, skriver forskarna Fredrik Gustafsson, Andreas Wacker, Bo Bernhardsson och Kristian Soltesz.

Publicerad 8 mar 2021 kl 09.00

Annons

Testa mycket är bra, men att även testa lite mer systematiskt kan leda till värdefulla insikter. Detta är slutsatsen vi drar utifrån en återblick på tre nyckelfrågor som ställdes av forskare, politiker, media och inte minst en bred allmänhet i början av det gångna året med coronaviruset:

● Varför gjordes inte fler tester?

● När når vi flockimmunitet?

● Hur stor är dödligheten?

Vi visar hur det med utgångspunkt i offentlig statistik, några få antaganden och ett transparent resonemang som enkelt kan reproduceras går att närma sig svaren på dessa frågor. Vi belyser också vilken typ av mätningar som gör detta möjligt och vilken data som skulle behövas för att minska osäkerheten i svaren.

Nyhetsflödet har under året dominerats av kurvor över antal dagliga dödsfall, IVA-inläggningar, med PCR-teknik konstaterade infektioner (här benämnda fall), med mera. Figur 1 visar 7-dagars släpande medelvärde av de tre nämnda dataserierna, hämtade från Folkhälsomyndighetens statistik den 4 februari 2021. Kurvorna är skalade och tidsförskjutna för att anpassa varandra. Detta har gjorts genom att optimera skalningen för varje tidsförskjutning och sedan välja den tidsförskjutning som gav bäst anpassning (i minstakvadratmening).

Annons

De erhållna skalfaktorerna ger enligt statistiken att det på varje IVA-inläggning går 2,5 dödsfall. Antalet dödsfall utgör vidare 1,5 procent av antalet fall. Bäst passning ger modellen med 17 dagar förskjutning mellan registrerade fall och dödsfall respektive 8 dagar mellan IVA-inläggningar och dödsfall.

Som synes i figur 1 stämmer de skalade och tidsförskjutna kurvorna rätt bra överens. Vi kan notera att kvoten mellan IVA-inläggningar och dödsfall är större under första vågen. Nu ska det dock påpekas att kurvorna över lag representerar olika individer. Till exempel utgör personer över 70 år en majoritet av dödsfallen (cirka 90 procent), men en minoritet av IVA-inläggningarna (cirka 30 procent).

Antagandena vi kommer att använda oss av är att (I) kvoterna mellan infektioner i samhället och rapporterade dödsfall är stabil över tid samt att (II) fördröjningarna mellan infektionstillfälle och registrerat fall respektive mellan infektionstillfälle och registrerat dödsfall är stabila över tid. Det vill säga, vi antar att det är infektioner i samhället som utgör det kausala sambandet som yttrar sig som korrelation mellan kurvorna i figur 1.

Figur 1. Rapporterade dagliga PCR-konstaterade fall (blått), IVA-inläggningar (grönt) respektive dödsfall (rött). Som framgår i figuren har kurvorna skalats och tidsförskjutits för att anpassa varandra.

Om vi godtar antagandet att dödsfall och IVA-inläggningar under 2020 återspeglat antalet infektioner i samhället, så kan vi med den enkla modellen i figur 1 rekonstruera kurvan för fall som hade detekterats fram till 11 juni, om en utbredd testkapacitet varit tillgänglig redan då. Vi utgår från dödsfallsdata, som kan antas ha mindre samplingsbias än IVA-inläggningar, då den till exempel inte påverkas av policybeslut inom vården (även om dessa inte verkar ha påverkat skalningen).

Nästa steg är att utifrån den röda kurvan i figur 2, som visar rekonstruerade fall utifrån dödsfallsdata, skatta antalet infektioner. Här använder vi data från de 5 randomiserade PCR-studier som under 2020 utfördes av Folkhälsomyndigheten för att mäta prevalensen, dvs förekomsten av pågående infektioner i samhället.

Studierna innefattade färre än 3 000 tester vardera, vilket ger upphov till en osäkerhet, vars skattade standardavvikelse (68 procent konfidensintervall) illustreras av de blå staplarna i figur 2 (där staplarnas bredd motsvarar provtagningsperioden för respektive studie).

Med minstakvadratmetoden kan vi nu interpolera vad de randomiserade testerna skulle ha visat om de genomförts dagligen. Detta illustreras av den röda kurvan i figur 2. Den ljusröda ytan illustrerar osäkerheten som enligt den enkla modellen skulle erhållits om den dagliga randomiserade testningen haft samma relativa omfattning som de 5 genomförda studierna.

Figur 2. Minstakvadratanpassad skalning av rekonstruerad falldata enligt figur 1 (rött) som interpolerar prevalens skattad genom randomiserade PCR-studier (blått).

Annons

Efter den nämnda skalningen summeras den röda kurvan i Figur 2 till 1,3 under 2020. Detta motsvarar att daglig testning av samtliga svenskar skulle ha genererat 13 miljoner positiva tester (vilket överskrider landets befolkning).

Hur många har då varit infekterade totalt? Det beror på hur länge en infekterad person testar positivt. Antar vi till exempel att en person överlag testar positivt i 10 dagar och därefter negativt, ger detta att 1,3 miljoner personer varit infekterade under 2020. Antar vi istället att PCR-detekterbarhet upphör efter endast 5 dagar, så motsvarar det 2,6 miljoner infektioner.

Både de nämnda antagandena ger skattningar långt under flockimmunitetsnivån. I och med att ca 9 800 dödsfall registrerats för 2020, så motsvarar dessa två antagande en dödlighet på 0,38 procent respektive 0,75 procent (av antalet infektioner) under 2020.

Läsaren kan själv utvärdera den enkla modellen för alternativa antaganden rörande detekterbarhet med PCR-teknik och på liknande vis ta höjd för samplingsbias i de randomiserade studierna till följd av begränsad svarsfrekvens från tillfrågade, att en viss andel av infektionerna är återinfektioner, med mera. Antaganden som dessa har linjär inverkan på antalet skattade infektioner.

“Vi borde ha testat mer i början” hör man ofta i media. Låt oss därför titta närmare på PCR-testerna, där vi måste skilja mellan randomiserade tester och allmänna tester. Under 2020 utfördes ca 5 miljoner allmänna PCR-tester, varav cirka 10 procent positiva. Detta ska jämföras med de 5 randomiserade studierna som sammanlagt innefattade 13 490 PCR-tester, varav cirka 0,4 procent positiva.

I figur 3 återges andelen positiva tester för vardera kategori, tillsammans med ±1 standardavvikelse hos den skattade osäkerhet som de begränsade testpopulationer i respektive fall ger upphov till.

Figur 3. Prevalensskattning utifrån andel positiva PCR-tester för de randomiserade studierna (blått) respektive den allmänna testningen (rött). Vertikal utsträckning representerar ±1 standardavvikelse för den osäkerhet som begränsningen i antal tester medför i respektive fall. Den allmänna testningen har hög precision, det vill säga låg standardavvikelse. Samtidigt är dess noggrannhet låg.

Skillnaden i andel positiva tester mellan kategorierna kan förklaras bland annat av att de allmänna testerna i stor utsträckning utförts vid misstänkt infektion, vilket leder till begränsad noggrannhet genom samplingsbias som dessutom kan förmodas variera över tid.

Däremot medför det stora antalet allmänna tester att begränsningen i precision till följd av begränsad testpopulation är försumbar jämfört med de randomiserade testerna. Ur detta perspektiv är det synd att vi bara använt cirka 0,3 procent av alla tester till randomiserad provtagning.

En bred testkapacitet är nödvändigt för att isolera fall, eller tillåta en person som testat negativt att till exempel återgå till arbete i vården. Samtidigt hade fler randomiserade tester lärt oss mer om pandemin. Att under 2021 löpande utföra randomiserad testning förefaller vara en god idé. Denna slutsats är även värdefull vid en kommande pandemi.

Redan för att estimera något så fundamentalt som antalet infektioner under 2020 har vi behövt göra två diskutabla modellantaganden. Sammantaget är det förvånansvärt lite vi lärt oss på riktigt från data under pandemin, all tillgänglig statistik till trots.

Vi vet också lite om fördröjningar i sjukdomsförloppet, såsom de från infektion till antingen fall, IVA-inläggning, eller dödsfall som vi indirekt skattar i Figur 1. Här skulle en systematisk sammanställning av anonymiserad hälsodata, i linje med vad KI:s rektor och två medarbetare föreslagit i SvD debatt, kunna ge viktiga insikter.

Svårigheten att med i dag tillgänglig data skatta historiska epidemiologiska nyckeltal belyser även vikten av tillförlitlig och informativ data för att ta sig an de större utmaningarna att med hjälp av modeller skatta, eller–än svårare–prediktera epidemiologiska nyckeltal.

Nästa pandemi kanske utgörs av en sjukdom med annorlunda spridningsdynamik eller sjukdomsförlopp. Då, som nu, kan data som samlats in i annat syfte än diagnostik av enskilda personer visa sig vara avgörande för förståelsen av den underliggande dynamiken och således vara av stort folkhälsovärde. Som sagt, att testa mycket är bra, men att även testa lite mer systematiskt och göra sammanställt material offentligt tillgängligt för forskning och debatt vore värdefullt.

Fredrik Gustafsson, professor i sensorinformatik, Linköpings universitet
Andreas Wacker, professor i teoretisk fysik, Lunds universitet
Bo Bernhardsson, professor i reglerteknik Lunds Universitet
Kristian Soltesz, docent i reglerteknik, Lunds Universitet

Så här har vi gjort

Alla anpassningar (förutom i figur 3) är gjorda med minstakvadrat-metoden, där den skalning och tidsförskjutning som minimerar den kvadratiska avvikelsen mellan två kurvor har valts.

Kurvan över antal fall är relativt sett färre än antal IVA-inlagda och döda innan mitten av juli, vilket är rimligt med tanke på den begränsade testkapaciteten under början av 2020. Vi har därför exkluderat falldata från innan juni 11 i optimeringen, vilket är datumet då regeringen tecknade en överenskommelse med SKR om ökad testning.

Vi har på grund av eftersläpning i rapportering exkluderat alla data från 2021. Det får här understrykas att värdena på de optimala skalfaktorerna och tidsfördröjningarna varierar något beroende på vilket datumspann som inkluderas i optimeringen. Kod för reproduktion av resultaten återfinns här.