6min

Hoe pak je big data aan? Door het klein te houden

M1404.p19.goudenei

De buzz rondom big data duurt nog altijd voort. Iedere zichzelf respecterende it-afdeling moet er wat mee.CIO’s zetten het op de agenda en reserveren er budget voor. Helaas tasten de betrokkenen vervolgens in negen van de tien gevallen in het duister. Wat doe je nu met die volgepropte datawarehouses? Hoe tover je die berg aan data om tot waardevolle informatie? Met andere woorden: hoe pak je big data aan?

De zienswijze van JanKees Lampe, CMO van Inergy, werkt ontnuchterend. “Eigenlijk,” zegt hij, “is big data niets nieuws. We werken er al 15 jaar mee, zij het dan uiteraard dat de volumes tegenwoordig ongekend groot zijn. Big data is onder meer zo’n hype doordat er nu drie onderdelen bij elkaar komen. Als eerste de data. Die zijn er natuurlijk altijd al geweest, maar als ze voldoen aan de vier V’s – volume, variety, velocity en validity – mogen ze big data worden genoemd. Het tweede onderdeel is de computing power. Dankzij de ontwikkelingen op dat gebied kunnen we steeds beter omgaan met die enorme hoeveelheid data. Het derde en meest recente onderdeel dat zich hier nu bij voegt, zijn de skills om uit de dataoverdaad daadwerkelijke kennis, informatie en meerwaarde te halen. Naar dat laatste onderdeel gaat onze speciale aandacht uit.”

Internet of things
Overigens beschouwt Lampe big data op zich niet echt als een beweging. “Het is eerder een gevolg van enkele grotere bewegingen, waarvan the internet of things zonder meer de belangrijkste is. De ontwikkeling dat allerhande spullen die wij gebruiken of waar wij mee werken – bureaustoelen, koffieapparaten, kleding en noem maar op – met het internet zijn verbonden, is al begonnen. Binnenkort krijgen we van ons koffieapparaat een e-mailtje waarin staat dat er een ontkalkingstabletje in het apparaat moet worden gegooid. We denken nu al dat we veel data hebben, maar met the internet of things komt er nog een veelvoud daarvan op ons af. Maar eigenlijk is die hoeveelheid data op zich niet zo boeiend. Veel interessanter is hoe we ermee omgaan. Hoe verkrijgen we de skills?”

De modelbouwer
Die laatste vraag is ook precies waar de markt mee worstelt op dit moment. De data is er, de computing power is en wat nu? “Het is natuurlijk een illusie,” vertelt Lampe, “om achter een bak met enorm veel data te gaan zitten in de hoop dat daar het gouden ei uit komt rollen. Elke vorm van analytics begint bij een bepaalde richting. Wat is een mogelijke business-case? Hoe concreter de vraag of richting, hoe makkelijker we kunnen gaan ‘minen’. En als we die vraag helder in beeld hebben, welke skills hebben we dan nodig om ermee aan de slag te gaan? Aan de ene kant hebben we business-analist. Hij begrijpt de business en is in staat om een business-issue te vertalen naar een vraag. Daarnaast is er de informatieanalist. Hij weet welke data en informatie er beschikbaar is en wat de dataelementen betekenen. De skills die we steeds nadrukkelijker nodig hebben, betreffen de rol tussen die twee typen analisten. Gartner noemt het de ‘data scientist’, maar ik geef de voorkeur aan de term ‘modelbouwer’. Of het een aparte rol gaat worden, weet ik zo net nog niet. Het kan ook dat de business-analist en de informatieanalist in de toekomst enkele skills zullen toevoegen aan hun profiel, op het gebied van wiskunde en statistische modelbouw.”

Volledige aansluiting
Als voorbeeld van een dergelijk model op basis van een vraagstuk, noemt Lampe een grote bank. “Stel, die bank heeft een website waar dagelijks enkele honderdduizenden bezoekers voorbij komen. Iedere bezoeker krijgt maximaal drie producten te zien, uit de enorm omvangrijke productportfolio van de bank. Het is de uitdaging om precies die drie producten te kiezen die het best aansluiten bij het profiel van de bezoeker. Dat levert immers de hoogste kans op conversie op. De generieke modellen om de kans op conversie zo te bepalen leveren resultaat. Maar dat resultaat wordt pas echt serieus beïnvloed wanneer het generieke model wordt toegespitst en getraind op bijvoorbeeld de specifieke doelgroep van deze bank. Bij ABN AMRO bankieren andere klanten dan bij Triodos bank of bij Rabobank. Eenzelfde voorbeeld is te geven in retail. Een van onze klanten, Detailresult, is het overkoepelend label waar onder meer de supermarkten Dirk van de Broek, Dekamarkt en Digros onder vallen. Een klant van Dirk is echt anders dan een klant van Deka of Digros. Die vragen dus elk om een eigen benadering. Precies het klantcontact waarin partijen zich echt kunnen onderscheiden van hun concurrenten. En daarin zit het bestaansrecht van de modelbouwer.”

Conversie
Op de vraag of de moeite die we stoppen in het ontwikkelen en trainen van modellen wel voldoende oplevert, antwoordt Lampe dat we hierin niet echt een keus hebben. “De generieke modellen gaan uit van een set van beschikbare data en ‘scheren hele groepen over één kam’, maar tegenwoordig komt er praktisch elke week een compleet nieuwe databron bij en als klant willen wij meer en meer op maat worden bediend. Uiteindelijk draait veel om conversie, conversie, conversie, wat vereist dat we voortdurend moeten blijven sleutelen aan onze modellen. En wie kan dat beter dan de modelbouwer?”

Behapbaar
Wat betreft het echt genereren van meerwaarde uit data staan we volgens Lampe nog aan het begin. “Zeker op het gebied van big data hebben we nog geen echte markt showcases gezien. Zo verzamelt Ahold al jarenlang enorme hoeveelheden data. Op basis daarvan heb ik nog geen zinvolle actie voorbij zien komen die op mij persoonlijk was toegespitst. Het kan heel goed dat ze zich verslikken in de overdaad aan data. Daarom adviseren wij onze klant ook: ga nou niet op zoek naar dat ene allesomvattende grote antwoord en het gouden ei. Maar hou het klein en behapbaar. Maak het niet groter dan het is. Laten we eerst eens twee onderwerpen – een use case of business-case – bij de kop pakken. En laten we op die onderwerpen stapjes gaan zetten. Gaandeweg zo’n traject vind je uit of er al dan niet een business-case uit te destilleren valt. Als dat zo is, ga je verder. Of terug naar de brainstorm. Dat is in ieder geval onze pragmatische aanpak, waar ons inziens een belangrijke rol is weggelegd voor de modelbouwer.”