Zebwares löfte: 500 gånger snabbare än molnet

2021-11-10 06:00  

Svenska Zebwares nya mjukvara gör det möjligt att köra avancerade ai-beräkningar i molnet – utan att kompromissa med cpu-prestanda. Förklaringen finns i matematiken.

”Där satt den – här har vi bevisen, Thomas”.

– Vi var hela tiden säkra på att algoritmen skulle leverera, men det är skönt att få det svart på vitt även från en extern part, säger Marie Johansson, vd för Zebware, ett svenskt mjukvarubolag som utvecklar teknik för datahantering och -säkerhet i molnet.

Den Thomas som Marie Johansson syftar på är Zebwares medgrundare Thomas Nilsson, med en lång erfarenhet av driva bolag – samt av att både bygga och använda avancerad datorarkitektur.

Rekordsnabb dataccess i molnet

Under den senaste tiden har Thomas Nilsson och Zebware arbetat intensivt med en ny mjukvara med potential att lösa en gordisk knut inom datacenter-infrastruktur. 

Under de senaste decennierna har vi sett en dataexplosion utan dess like. I kölvattnet av den ökar användningen av artificiell intelligens, maskininlärning och dataanalyser. Ett stort hinder när det gäller datacenter handlar om prestanda och responstid – det vill säga hur snabbt stora datavolymer kan flyttas från servrar för långvarig lagring, till beräkningsklustren som används för ai och andra avancerade operationer.

Läs mer: Så ska Facebook lära ai se som människor

Zebwares lösning på problemet är en ny algoritm som fixar en så pass snabb och effektiv dataåtkomst i hybridmolnlösningar att data som lagras i molnet ska kunna användas till exempelvis maskinlärning – utan att man behöver kompromissa med cpu-prestanda.

Snabba beräkningar lokalt

Nu har bolaget nått ett genombrott under hårdtester som genomfördes vid Intels 5G Innovation Center i Stockholm nyligen.

Innovationen bygger på ett så kallat disaggregerat upplägg för hybridmoln. I Zebwares fall innebär det att alla data vid behov kan flyttas med tre lager, eller tiers. Bolagets nya programvara ser sedan till att alla data kan strömma mellan lagren – ett kallt, ett varmt och ett hett – på ett snabbt och effektivt sätt.

Det kalla lagret består av molnbaserade tjänster för långvarig lagring, och mellanlagret, det varma, ligger på ssd som delas mellan olika noder. Högst upp – i det heta varma lagret – finns lokala servrar där virtuella maskiner med supersnabba Intel optane pmem- och nvme ssd-minnen tar hand om de tunga jobben. Hit flyttas data för ai-beräkningar, exempelvis.

– Det gör att vi kan skala upp hur många applikationsnoder som helst. Data skrivs först till det varma lagret, men när den läses in på en nod flyttas den till det heta. När data inte behövs längre går den vidare till molnlagringen i det kalla lagret, säger Thomas Nilsson.

Ger prestandaskjuts

I valideringstesterna hos Intel mättes hur snabbt Zebclient kan servera data från de tre lagren i hybridmolnet till applikationen på beräkningsnoden. 

Resultatet: En dataaccess som var 500 gånger snabbare jämfört med om applikationen hade kopplats direkt mot molnlagring med en fast 1 gigabit-lina. 

– Många applikationer är inte särskilt snälla mot varken cpu:er eller data utan tar väldigt mycket kräm i anspråk. Våra tester visar att vi markant kan sänka antalet cykler det tar för att hämta data som behövs för att utföra en viss operation, vilket ger högre prestanda. Det ökar helt enkelt tiden som applikationerna faktiskt får tillgång till cpu:ernas fulla effekt, säger Thomas Nilsson.

– Första mätningarna visar pmem-accelerationen på en nod på en maskin. I nästa verifieringssteg hos Intel ska vi testa algoritmen på ett kluster, och då får man multipla noder som hämtar data från flera olika håll, fortsätter han. 

Läs mer: Vad är metaverse, och varför pratar alla om det nu?

Tror ni att mjukvaran kommer att ge en lika stor skjuts även på klusternivå?

– Ja, för en klusterinstallation med flera noder kommer vi att kunna ge en lika stor eller större ökning av åtkomsthastigheten, säger Marie Johansson, vd på Zebware.

"Snabbaste cpu-operationen"

Förklaringen till prestandalyftet finns i Stockholmsbolagets patenterade erasure code, eller raderingskod som det kallas på svenska. Det är en metod för skydd av data där datamängderna bryts upp i små fragment som fylls ut med redundant information och sedan lagras på olika servrar.

För att se till att ingen data förändras eller försvinner beräknas ett kontrolltal för varje del – stämmer talet är datamängden korrekt. 

Problemet med dagens erasure code är, enligt Thomas Nilsson, att den underliggande matematiken – som bygger på matrisoperationer – är för komplicerad. Det tar ut sin rätt på prestandan.

Lösningen för Zebware blev att använda så kallade vektorberäkningar och exklusiv disjunktion, vilket inom programmering betecknas XOR. Kortfattat kan det beskrivas om ett logiskt villkor där ”A eller B, men inte båda” är sanna. 

Resultatet blev en mer effektiv erasure code-algoritm som serverar data snabbare i ett hybridmoln.

 – Det är den absolut snabbaste operationen du kan göra på en cpu. Jag var ute efter något som enbart innehåller plus och minus – vilket i grund och botten är det enda som en cpu faktiskt kan förstå. Genom att vi kan göra flera operationer simultant på flera beräkningsnoder i ett kluster, kan vi lösa matematiken från håll samtidigt, vilket också ökar prestandan, säger Thomas Nilsson.

Hur avhängiga är mätresultaten av Intel?

- Vi är inte bundna till Intel. Resultaten är byggda på deras hårdvara, men vi får mycket bra värden även med annan hårdvara – oavsett om den finns lokalt eller i molnet, säger Marie Johansson.

Vilka ska använda er mjukvara – molnleverantörerna eller företagen som köper molntjänster?

– Vi riktar oss både mot partners och slutkunder. Vi har ett case där vi jobbar med en molnleverantör för att göra det möjligt för dem att vidga sitt erbjudande till ai och analytics. Deras utmaning i dag är att kunna tillhandahålla data tillräckligt snabbt, säger Marie Johansson, vd på Zebware.

– Men vi jobbar också med dataskydd och skalbarhet inom den finansiella sektorn där man vill kunna dra nytta av molnlagring, men samtidigt säkerställa att den skyddas så effektivt som möjligt, fortsätter hon.

Fakta: Zebware

Gör: Mjukvara för hantering och skydd av data i hybridmoln.

Grundat: 2013.

Anställda: 18 med konsulter.

Ort: Stockholm.

Omsättning 2020: < 100tkr.

Finansiering: Eget kapital.

Kalle Wiklund

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

  Kommentarer

Debatt