Starten met big data kan ook prima op kleine schaal

BI en Big Data

Het begrip big data weerklinkt de laatste jaren steeds nadrukkelijker in ondernemersland. Vaak voorzien van verontrustende toevoegingen als ‘er is geen toekomst zonder big data’ en ‘zorg dat je de boot niet mist’. Tegelijkertijd blijft het fenomeen voor veel bedrijven nogal vaag en ongrijpbaar, hoewel de wens om er ‘iets mee te doen’ steeds groter wordt. Maar hoe pak je dat aan? Hoe ga je starten met big data?

De beurs Big Data Expo te Utrecht stond in het teken van die laatste vraag en gezien de drukte op de beursvloer mag je veronderstellen dat big data nog altijd niet erg is ingeburgerd in Nederland. Terwijl big data in de letterlijke zin van het woord natuurlijk al wél volledig bezit heeft genomen van onze maatschappij. Denk daarbij aan het groeiende Internet of Things en de vloedgolf aan data afkomstig van e-mailconversaties, social media, websites, voorraadcijfers, toeleveranciers, et cetera.

Beloning

Met slechts de aanwezigheid van al die data begin je echter niet zoveel. Het gaat er immers om dat je in staat bent om vanuit die enorme brij aan informatie de vertaalslag te maken naar heldere bedrijfsinzichten en slimme keuzes. Pak je dit op de juiste manier aan, dan volgt er een beloning. Volgens Gartner hebben bedrijven die big data-analyse inzetten namelijk zo’n 20 procent voordeel op concurrenten die dat niet doen.

Je zou dus kunnen vermoeden dat bedrijven big data inmiddels wel massaal omarmd en geïmplementeerd hebben. Toch is dit niet het geval. Marco van den Brandhof, salesmanager bij Puur Data, schat desgevraagd in dat in Nederland hooguit zo’n 30 procent van het aantal bedrijven zich daadwerkelijk bezighoudt met big data. Zijn bedrijf, ook aanwezig op de Big Data Expo en gespecialiseerd in big data analytics, hoort daarom nog altijd vaak de hulpvraag: ‘ik lees veel over big data, maar wat moet ik ermee?’ Dikwijls aangevuld met: ‘ik wil de boot niet missen, want bijna iedereen is er al mee bezig’.

Adaptatie per sector

“Dat laatste blijkt dus niet het geval te zijn”, stelt Van den Brandhof. “Hoewel de interesse en adaptatie per sector behoorlijk verschillen.” De groep voorlopers wordt volgens hem gevormd door de financiële sector. Banken houden zich al sinds jaar en dag bezig met big data. Maar ook in de retail is big data een ‘big issue’, terwijl daar de daadwerkelijke implementatie dan juist weer redelijk beperkt is. Van den Brandhof: “Naast de retail vormen ook de industrie en de gezondheidszorg potentieel enorm belangrijke markten voor big data. De industrie lijkt echter sectorbreed wat achter te lopen, terwijl in de gezondheidszorg privacyissues een belangrijke rem vormen op de ontwikkeling van big data.”

Big Data toetsenbordPraktijkvoorbeelden

Hoe het ook zij, big data kunnen voor elke sector en elke branche interessante inzichten opleveren. Dat bleek wel uit de inspirerende stroom praktijkvoorbeelden die op de Big Data Expo over het voetlicht werden gebracht. Zo weten we inmiddels dankzij big data dat luiers en kratten bier vaak samen worden verkocht doordat beide producten veel volume innemen (en dus bij voorkeur worden aangeschaft als de auto beschikbaar is voor de boodschappen), dat data afkomstig van het liftgebruik in een bedrijfsverzamelgebouw aan de verhuurder onthult welk bedrijf op welke verdieping het meest succesvol is en dat er een verband bestaat tussen filevorming op de weg en griepcijfers.

Ook Puur Data benoemde enkele interessante praktijkvoorbeelden. Van den Brandhof: “Wanneer je het stroomverbruik van allerhande machines en machineonderdelen in de gaten houdt, kun je enorm besparen op onderhoudskosten. Een apparaat of onderdeel dat op zijn laatste benen loopt, gaat namelijk afwijkingen vertonen in het stroomverbruik. Door hierop in te haken, kun je onderhoud op maat toepassen in plaats van onderhoud op basis van de gemiddelde levensduur.” In een ander voorbeeld wordt de route gevolgd die klanten afleggen door een fysieke winkel, dankzij wifi en de smartphone van de klant. Wanneer klanten ook nog eens inloggen op het wifi-netwerk van de winkel, worden ze als het ware wandelende cookies. Dit verschaft de winkel de mogelijkheid om online en offline marketing beter op elkaar af te stemmen.

Zelf aan de slag

Maar terug naar de hamvraag én het thema van de beurs: hoe ga je starten met big data?

Allereerst moet je natuurlijk zorgen voor voldoende draagvlak binnen de organisatie. Dat is geen vanzelfsprekendheid. Ook de ervaring van Van den Brandhof leert dat meestal slechts een klein aantal mensen binnen een organisatie met big data aan de slag wil gaan, terwijl een grote groep het fenomeen nog altijd ziet als hype. “Wat vaak een enorm positieve bijdrage levert aan het creëren van draagvlak voor een big data-project, is om klein te beginnen”, zo stelt hij. “Dat klinkt misschien tegenstrijdig, maar kan heel goed. Zo houd je de kosten binnen de perken, terwijl je toch een volwaardige eerste ervaring opdoet. Definieer daarom een goed afgebakende doelstelling en haal informatie uit maximaal drie bronnen, zodat alles behapbaar en overzichtelijk blijft.”

Ook de rolverdeling binnen een big data-project is volgens Van den Brandhof van groot belang: “Het moge duidelijk zijn dat de business definieert en ICT faciliteert. Dit neemt echter niet weg dat beide afdelingen tijdens het traject prima samen de kar kunnen trekken, wat bovendien een welkome kruisbestuiving van kennis oplevert.”

Vervolgens zal je, zodra je daadwerkelijk aan de slag gaat, al snel te maken krijgen met de twee belangrijkste uitdagingen van big data: het aan elkaar koppelen van gestructureerde data (zoals cijfers) en ongestructureerde data (zoals teksten uit social media) én het analyseren van de eindresultaten. Van den Brandhof: “Voor de eerste uitdaging wordt door ons – en vele anderen – het filesysteem Hadoop gebruikt, dat prima overweg kan met een wirwar aan verschillende dataformats. Voor de tweede uitdaging, de uiteindelijke analyse, is de beheerder van de betreffende data de aangewezen persoon. Die is immers als beste in staat om te analyseren en te interpreteren.”

De kosten en doorlooptijd hoeven bij zo’n eerste project overigens niet enorm hoog te zijn. “De minimale kosten zullen ongeveer zo’n 10.000 euro bedragen”, schat Van den Brandhof in. “Maar we hebben het hier over maatwerk, dus daarop valt lastig een algemeen prijskaartje te plakken. Qua doorlooptijd is een maand zeker niet onhaalbaar.”

Big Data puzzel

Toekomst

Tot slot rest natuurlijk de vraag of big data de komende jaren nu eindelijk wél echt zal gaan doorbreken in Nederland. Van den Brandhof, heel stellig: “Jazeker, big data is een blijvertje. Ik verwacht dat de adaptatie van big data de komende twee à drie jaar een enorme vlucht zal gaan nemen. Vooral binnen de retail, waar de vernieuwingsdrang als gevolg van de crisis de laatste tijd sowieso flink is aangewakkerd.”

X