Big data, de revolutie voorbij

Zoals iedere hype, weet ook big data de wereld grofweg te verdelen in twee kampen. De evangelisten die menen dat de wereld met big data een draai van minstens 180 graden zal maken. En de cynici die daarentegen vinden dat big data niets meer is dan een andere term voor wat er al jaren is. Ongetwijfeld zal ook hier de waarheid ergens in het midden liggen.

Hoe we ook tegen big data aankijken, de cijfers over het explosief gestegen dataverkeer liegen niet. Volgens Cisco zal het mobiele dataverkeer in 2016 drie keer zo volumineus zijn dan het vaste dataverkeer. Dit wordt gestaafd door cijfers van providers. Zo steeg het datavolume in één jaar tijd met 80 procent bij Vodafone en Proximus. Dit komt voornamelijk voort uit de stormachtige ontwikkelingen op het gebied van the internet of things. Het is dus evident dat we letterlijk te maken hebben met big data.

Petabytes
Renald Buter van GoDataDriven stelt dat de techniek van de opslagcapaciteit zich de afgelopen jaren razendsnel heeft ontwikkeld. Het is niet eenvoudig voor de wereld van datamanagement om daarmee gelijke tred te houden. De relationele, gestructureerde databases bleken uiteindelijk niet of nauwelijks opgewassen tegen de stortvloed van ongestructureerde data die wij nu dagelijks produceren. Als een van de eersten maakte Google in 2003 de analyse van big data schaalbaar. Dat deden ze niet door de data naar het analyseprogramma te halen, maar door dat programma te verspreiden over de gedistribueerde delen van de data. De ingenieurs van Yahoo gingen met dit principe aan de haal en bouwden Hadoop. Met dit open source softwareraamwerk kunnen applicaties petabytes aan ongestructureerde data in een cloud-omgeving verwerken op alledaagse hardware. Binnen korte tijd ontstond er rondom Hadoop een heel ecosysteem van gerelateerde, open source big data technologie.

Expertises
Om big data naar je hand te zetten heb je volgens de auteur data scientists en data engineers nodig. De data scientist is iemand die net zo makkelijk software bouwt als statische en machine learning modellen en ook nog eens een neus heeft voor welke toepassingen je bedrijf verder helpen. De data engineer is iemand die ook weet hoe je software kan bouwen, maar dat ook nog eens kan onderbrengen in schaalbare oplossingen om de grote hoeveelheid en diversiteit data te verwerken.Volgens Buter betaalt een investering in deze expertises zich ruimschoots terug.

Hype
Van het hypegehalte van big data is JanKees Lampe, CMO van Inergy niet bijzonder onder de indruk. “Eigenlijk,” zegt hij, “is big data niets nieuws. We werken er al 15 jaar mee, zij het dan uiteraard dat de volumes tegenwoordig ongekend groot zijn. Big data is onder meer zo’n hype doordat er nu drie onderdelen bij elkaar komen. Als eerste natuurlijk de data. Het tweede onderdeel is de computing power en het laatste en meest recente onderdeel dat zich hier nu bij voegt, zijn de skills om uit de dataoverdaad daadwerkelijke kennis, informatie en meerwaarde te halen. Eigenlijk is de hoeveelheid data op zich niet zo boeiend. Veel interessanter is hoe we ermee omgaan. Hoe verkrijgen we die skills?”

De modelbouwer
Lampe wijst erop dat iedere vorm van analytics begint bij een bepaalde richting. Wat willen we weten? Hoe concreter de vraag of richting, hoe makkelijker we kunnen gaan ‘minen’ in de big data. Ook weten we dan welke skills we nodig hebben om ermee aan de slag te gaan? Lampe onderscheidt de business-analist – hij begrijpt de business en kan een business-issue vertalen naar een vraag – en de informatieanalist – hij weet welke data en informatie er beschikbaar zijn en wat de dataelementen betekenen. “De skills die we steeds nadrukkelijker nodig hebben, betreffen de rol tussen die twee typen analisten. Gartner noemt het de ‘data scientist’, maar ik geef de voorkeur aan de term ‘modelbouwer’.” In de wereld van data-analyse draait alles uiteindelijk om conversie. “We moeten dus voortdurend blijven sleutelen aan onze modellen. En wie kan dat beter dan de modelbouwer?”

Van data naar informatie
CommVault, leverancier van de softwaresuite Simpana, heeft een eigen visie op Big Data. Michiel von der Crone, Director Field Advisory Services Team EMEA, vidnt dat data op zich eigenlijk een beperkte waarde hebben. Waar het om gaat, betoogt hij, is dat we van die data bruikbare informatie moeten zien te maken. “Dat is een van de meerwaarden die wij met onze softwaresuite Simpana willen bieden: een oplossing om ruwe data te transformeren naar relevante informatie.”

Geef een reactie

Gerelateerde berichten...