Löftet från svenska bolaget: ”Anonym ansiktsigenkänning”

2019-08-22 06:00  

Kan man göra gdpr-kompatibel ansiktsigenkänning för användning i svenska butiker? Japp, säger en startupen Indivd från Sundsvall.

Den fysiska handeln och e-handeln har helt olika förutsättningar när det gäller att förstå kundbeteenden.

– Jämfört med online vet fysiska butiker i princip ingenting om sina kunder. Det kan till och med vara så att de instruerar sin personal att följa efter vissa kunder i butiken för att få veta vad som händer, säger Leonard Johard, ai-forskare och teknisk chef för Indivd, en startup från Sundsvall.

Det här tänker Indivd ändra på – med ansiktsigenkänning. Den omstridda tekniken är starkt reglerad av dataskyddsförordningen gdpr, eftersom biometrisk identifiering anses vara en extra känslig personuppgift. Men Leonard Johard hyser inga som helst tvivel om att Indivds lösning med vad han kallar anonymiserad ansiktsigenkänning - som onekligen låter som en paradox - efterlever gdpr.

– Det gör den absolut. Vi har satt en mycket högre anonymiseringsstandard än vad som idag anges för exempelvis patientdata.

Företaget Baker McKenzie, specialister på affärsjuridik, har på uppdrag av Indivd validerat lösningen och anser att ”tekniken höjer säkerheten för besökarens integritet”. Vad en sådan validering har för betydelse i praktiken återstår att se, det är trots allt Datainspektionen som är tillsynsmyndighet i frågor som rör gdpr.

Så hur fungerar det? En butik kan kombinera sina övervakningskameror med Indivds programvara. Det unika med den är att den läser av ansikten men sparar bara ett, som Leonard Johard beskriver det, ”fragment av identiteten”.

– Har vi bara information från en person så kan man inte säga så mycket. Men om vi har tusen personer kan vi pussla ihop alla bitar och få ett statistiskt mått som exempelvis säger hur många personer som kommer tillbaka. Vi kan mäta hur många personer som både går in i en butik och sedan går till kassan. Det vi inte kan göra är att rikta marknadsföring till en enskild individ för vi har inte den informationen. Vi kommer aldrig att kunna ge en personlig kundupplevelse, säger Leonard Johard.

Läs mer: Så vill polisen använda ansiktsigenkänning – ”Hoppas vara igång i höst”

Fredrik Hammargården, medgrundare av Indivd, tillägger:

– Eftersom en ”datapunkt” i sig inte går att kopplas till en fysisk levande person, som i klassisk ansiktsigenkänning där man sparar personuppgifter i form av biometrisk data som kan kopplas till en fysisk person, så behöver vi volym för att kunna göra träffsäkra insikter. Det gör vi med anonymiserad data, analyser i form av statistiska modeller. Med en sådan form av data ökar träffsäkerheten med antalet.

”Kedjor och butiker har hört av sig”

Tillsammans med Karina Liljedal, forskare på Handelshögskolan i Stockholm, genomförde Indivd nyligen ett test med 230 frivilliga personer som fick besöka en livsmedelsbutik och ett kafé. Testet demonstrerade att Sundsvalls-företagets teknik kunde återidentifiera 85 procent av besökarna.

– Vi känner till sedan tidigare att vi med traditionell ansiktsigenkänning kan återidentifiera personer med 99,75 procents noggrannhet. Det här testet visar att vi kan nå 85 procents noggrannhet med anonymiserad ansiktsigenkänning. Men ju mer data som samlas in, desto högre blir träffsäkerheten. Så vi tror att vi snabbt kan komma upp i 95 procent, utan att lagra personlig data. Det är väldigt tillfredsställande, säger Leonard Johard.

Indivds lösning kommer lägligt. I somras beslöt Datainspektionen att inleda en granskning av entreprenören Isabella Löwengrips teknikbolag Nordic Tech House, efter uppgifter i olika medier om att företaget skulle testa ansiktsigenkänning i en butik i Stockholm. På frågor som skickats av Datainspektionen till Nordic Tech House svarar en av medgrundarna, Linus Kaasik, att dotterbolaget NTH Retail Lab ”endast är i startgroparna och det har inte kommit längre än att vi har börjat tala med olika leverantörer av ansiktsigenkänningsteknik för att jämföra likheter och skillnader”.

Fredrik Hammargården vill inte säga om NTH Retail Lab hört av sig till Indivd.

– Många kedjor och butiker har hört av sig till oss och vi har fört initiala diskussioner med flera men vi har beslutat att, till att börja med, fokusera på ett visst antal piloter.

Läs mer: Gymnasieskola får böta för ansiktsigenkänning – bröt mot GDPR

För att vara en startup som bildades så sent som 2018 har det gått snabbt för Indivd. Nyligen beslöt IBM i Sverige att påbörja ett partnerskap med bolaget, i vad IBM beskrivit som en av deras största satsningar någonsin på en svensk startup.

– Vi får tillgång till servrar, hårdvara och beräkningskraft. Och vi får hjälp med att bygga säkerhet, säger Leonard Johard.

– Gdpr i sig handlar inte bara om informationssäkerhetsperspektiv. Det behöver även vara säkert ur ett it-säkerhetsperspektiv. Därför har vi tagit hjälp av specialister från IBM Security för att granska och säkerställa vårt system, vår organisation och vår anonymiseringsprocess i form av en riskanalys med lösningar för att ”täppa till” eventuella hål, säger Fredrik Hammargården.

Leonard Johard ser fler tillämpningar än bara för handel.

– Eftersom inte handeln vet någonting blir den ineffektiv. Information om deras kunder skulle förstås vara bra finansiellt, men det skulle också kunna ge besparingar för samhället i form av mer effektiv logistik. Man skulle också kunna använda det vid tunnelbanor, byggnader, festivaler och mässor. Vilka rutter tar folk, hur beter de sig?

Däremot skulle tekniken inte kunna användas vid brottsbekämpning. Om en butik med övervakningskamera använder Indivds teknik kan den inte med ansiktsigenkänning spåra en person som begår ett brott.

– Nej, precis. Det kan vi inte göra, konstaterar Leonard Johard.

Identiteten röjs inte

Ett företag som dock funderar i de banorna är Visage Technologies från Linköping, som säljer teknik för följning, analys och igenkänning av ansikten. Jörgen Ahlberg, forskningschef på Visage, säger att man på video från övervakningskameror skulle kunna maskera verkliga personers ansikten med så kallade deepfakes, där man med artificiell intelligens ersätter den verkliga personens ansikte med ett ansikte som inte existerar.

– Har du sett (sajten) Thispersondoesnotexist? Säg att man kan gå igenom videosekvenser på ett integritetsbevarande sätt genom att byta människorna på bilden mot syntetiska människor. Man kanske vill ha kvar sammanhanget: ”här är en kvinna i 30-årsåldern som blir rädd”. Men kvinnan är inte misstänkt för något brott så hennes identitet röjs inte. Men letar man efter en misstänkt skulle polis efter ett beslut motsvarande en husrannsakan kunna ”låsa upp” ansiktet på den eftersökte, säger Jörgen Ahlberg.

Ahlberg konstaterar att det redan existerar ”väldigt mycket kameraövervakning” men att man med ett sådant system skulle kunna bedriva övervakning och samtidigt stärka integriteten.

– Det är inget vi jobbar med nu, men det vore kul att sätta ihop ett forskningsprojekt för att ta sig an det.

Så fungerar ansiktsigenkänning

Ansiktsigenkänning i stor skala blev möjligt tack vare den djupa maskininlärningens genombrott i början av det här årtiondet. Djup maskininlärning eller djupa neurala nätverk handlar om ett datorprogram som lär sig på egen hand. Att det kallas ”neuralt” eller ”neuronnät” kommer sig av att tekniken är inspirerad den mänskliga hjärnans egenskaper för att omvandla data till information. Det är en variant av det bredare begreppet maskininlärning, som i sin tur är en del av det vi kallar artificiell intelligens.

Med djup maskininlärning serveras en algoritm träningssdata och spottar ut ett resultat. Men på vägen mellan dessa två tolkar algoritmen signalerna – alltså träningsdata – i ett antal lager. För varje nytt lager ökar graden av abstraktion.

Säg att du vill bygga ett djupt neuralt nätverk som kan skilja olika ansikten åt eller som kan avgöra vilka ansikten som är identiska. Träningsdata bör då vara ett stort antal bilder på ansikten (ju större dataset, desto mer pricksäkert blir nätverket, åtminstone i teorin). Dels på olika ansikten, men också många bilder på samma ansikte. En dator ser naturligtvis inte ett ansikte på bilden, utan ett antal värden som representerar olika pixlar. Med pixlarna som underlag lär sig det djupa neurala nätverket hitta mönster. För varje lager som passeras i nätverket blir vissa mönster mer intressanta (starkare signal mellan ”neuronerna” i nätverket) medan andra nonchaleras (svagare signal); under träningen ändras det som ai-människor kallar ”vikterna” på de olika signalerna för att allt bättre producera det önskade resultatet.

Första, andra och hundrade gången algoritmen genomför den här proceduren brukar resultatet inte vara så bra, men så småningom kan nätverket uppnå imponerande resultat. På ett sätt kan man säga att nätverket lärt sig abstrahera och generalisera, från råa pixelvärden till klassificering av olika människors ansikten. Men det är kanske inte vad vi människor tänker på när vi använder de begreppen: det rör sig snarare om att nätverket klurat ut ett antal mätvärden som är unika för varje ansikte. Serveras det färdigtränade nätverket en ny bild på ett ansikte kan den matcha det ansiktets mätvärden mot ansikten på andra bilder. Genererar den ungefär samma värden för olika bilder är det sannolikt samma person på båda bilderna.

Det kallas djup maskininlärning eftersom en sådan modell kan använda flera – ibland hundratals – lager. Där finns också en symbolisk mening på så vis att vi människor inte riktigt kan begripa hur datorprogrammet gör för att hitta mönster. Den opererar så att säga djupt, under ytan.

Även om algoritmerna utvecklas och raffineras allt eftersom är det egentligen två andra orsaker som ligger bakom de djupa neurala nätverkens genombrott: tillgång till stora dataset och billig beräkningskraft, framförallt i form av grafikkort som tidigare mest var förknippat med datorspel.

Man kan också ha i åtanke att den ovan beskrivna metoden för klassificeringsändamål bara är en av många. Men den är vanligt förekommande.

Peter Ottsjö

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

  Kommentarer

Debatt