DNA-analyse binnen zes uur met Belgische Big Data-oplossing

data datawarehouses

DNA-analyse met elPrep big-data-software heeft voor een doorbraak gezorgd. Het Belgische Imec kan via deze methode DNA analyses in minder dan zes uur mogelijk maken.

De Leuvense onderzoeks- en innovatiehub werkt al langer aan big-data-gebaseerde DNA-analyses. Dankzij de nieuwste softwareversie kunnen de gigabytes aan data uit DNA-stalen nu in enkele uren tijd informatie opleveren over mogelijke genetische afwijkingen. Dat is 8 tot 16 keer sneller dan met de meest gangbare software. De techniek kan draaien op een klassieke server.

Het opent mogelijkheden voor ziekenhuizen om zelf DNA-analyses uit te voeren in plaats van ze  te moeten uitbesteden aan gespecialiseerde analyselabo’s. Verscheidene industriële partners tonen al interesse om de nieuwe elPrep-software in gebruik te nemen.

Snel en goedkoop

Snel en goedkoop analyseren van genetische informatie is een van de essentiële vereisten van de toekomstige gezondheidszorg. Hier spelen ziektepreventie, voegdiagnose en patiëntgerichte therapie een grote rol. De kosten van DNA-analyse bereikte de laatste tien jaar al het punt waardoor ze bruikbaar zijn als standaard diagnose-instrument. De doorlooptijd, tot 48 uur voor een volledig genoom, bleef daarbij wel een struikelblok.

DNA-analyse bestaat namelijk ruwweg uit twee delen. Ten eerste het omzetten van een fysiek DNA-staal in een digitale reeks ‘letters’ (baseparen) waaruit het DNA bestaat. Ten tweede het analyseren van die digitale DNA-gegevens om bijvoorbeeld te kijken of er genetische afwijkingen in optreden.

In dit hele proces wordt de fysieke DNA-streng in stukjes geknipt en vermenigvuldigd. Het digitaliseren ervan (sequencen) levert gigabites aan data op, waaruit de oorspronkelijke streng dan weer opgebouwd moet worden om hem vervolgens te kunnen controleren op afwijkingen. In technische termen heet dat ook wel variant calling. Een complex proces dat veel rekenkracht en big-data-analysemethodes vraagt.

elPrep

Imec haalt met elPrep dergelijke snelheden doordat de software slechts eenmaal door alle data leest om vervolgens alle bewerkingen uit te voeren. Zoveel mogelijk data blijft daarbij de hele looptijd in het geheugen. Andere software laadt telkens slechts fracties van de data in het geheugen. Dat betekent dat het meerdere malen de oorspronkelijke data moet scannen. Dat betekent verlies van snelheid.

Volgens Charlotte Herzeel, onderzoeker bij imec is hiervoor geen supercomputer nodig. De uitvoer kan op een klassieke server plaatsvinden. “Dit heeft als voordeel dat hospitalen de volledige analyses zelf zouden kunnen uitvoeren en ook hun dagelijkse werking veel efficiënter wordt. Een dokter kan ’s avonds een analyseberekening opstarten en de volgende ochtend al de resultaten bespreken met de patiënt. En, omdat hospitalen vaak cloudoplossingen huren zorgt de snellere verwerking ervoor dat ook de kost substantieel vermindert.”

Lees ook:
  • De volgende stap in AI: herkenning van medische taal
  • De pandemie te lijf met big data analytics

 

Gerelateerde berichten...

X