Svensk databasteknik nystade upp Panama-härvan

2016-04-06 11:39  

Grafdatabasen användes för att hitta kopplingar i dokumenten.

Fler programvaror än den australiska sökmotorn Nuix användes när journalistnätverket ICIJ knäckte läckan på 11,5 miljoner dokument. Bland annat blev ny svensk databasteknik användbar.

Nya uppgifter kommer nu om hur Panama-dokumenten hanterats av ICIJ, det nätverk av grävande journalister som jobbat med läckan.

Utöver sökmotorn Nuix, som kan processa, indexera och analysera ostrukturerade dokument. Har man använt Paris-baserade företaget Linkurious Enterprise's visualiseringsverktyg. Med hjälp av det kan man upptäcka finansiella transaktioner och relationer som ligger dolda i stora mängder av data.

Underliggande i plattformen finns svensk databasteknik. Den nyttjar nämligen grafdatabasen Neo4j, som utvecklats av personer i Malmö-/Lundområdet och som i dags säljs av det snabbväxande bolaget Neo Technology, som har utvecklingskontor i London och Malmö. I Neo4j kan man spåra kopplingar mellan olika värden som exempelvis personer och företag.

Maria del mar Cabra Valero är data- och forskningsansvarig på ICIJ och säger så här om Neo4j i ett pressmeddelande från Neo Technology:

”Det är ett revolutionerande verktyg som har förändrat vår grävande journalistiska process, eftersom relationer är så viktiga när det gäller att avslöja var kriminalitet finns, vem som jobbar med vem, och så vidare”.

Hon beskriver att dataläckan var utan motstycke och att man behövde ett system som kunde hantera minst 11, 5 miljoner dokument som hade många bindningar till varandra på ett smidigt sätt.

Johan Svensson - teknisk chef på Neo Technology och medgrundare till bolaget - förklarar att systemet kan hantera större mängder än de 2, 6 terabyte av data som Panama-läckan omfattar.

Han har inte själv haft kontakt med reportrarna men bedömer att ICIJ använt Nuix för att få ordningen på dokumenten, och att man sedan har laddat in all data i Neo4j för att analysera relationer.

Via Linkurious-plattformen har man sedan också tydligt kunnat visualisera och presentera kopplingarna mellan de företag och personer som anlitat advokatfirman Mossack Fonseca i Panama.

– På 70- och 80-talet fanns det relationsdatabaser med rader och kolumner. De fungerade bra då. Men i dag har vi mycket mer av komplex information, och man vill framförallt veta hur saker och ting är relaterade till varandra, säger han.

– Traditionella databaser lagrar inte relationer explicit, i stället kan man implicit få reda på dessa när man ställer en fråga. Vi lagrar i stället hur data är relaterat till varandra, vilket gör att vi kan svara på frågor snabbare, förklarar Johan Svensson.

Namnen på företag och personer bildar i det här fallet noder i databasen.

Neo4j finns som open source-variant, och är gratis för allmänheten.

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

  Kommentarer

Debatt