Het vermaarde natuurkunde-instituut Cern zag in korte tijd twintig natuurkundigen en computerwetenschappers naar KPMG’s big data groep vertrekken, onder leiding van hoogleraar Sander Klous.
Alsof Ajax een heel team van Spakenburg koopt, zo opvallend is de overstap van wetenschappers naar KPMG. “Deze maand komen er nog een Chinees en een Canadees bij ons team,” vertelt Klous. “In de datawetenschappen weten we wie ertoe doen en zij weten ons te vinden.” Volgens hem gaat het niet alleen om geld. “Wetenschappers bind je niet met louter een goed salaris. Ze willen uitdagingen en met andere slimme mensen samenwerken.” Klous bouwde het team op voor KPMG met dataspecialisten uit Nederland, Italië, Roemenië, Engeland en Zuid-Afrika. Mensen die vooral hebben gewerkt met de bekende deeltjesversneller van Cern.
Geen Cesna’s maar Boeings
Het wel even wennen bij het bedrijfsleven. “Mijn persoonlijke cultuurschok was de korte termijn. Bij Cern werken we over een tijdspanne van vijftien jaar en hier kwam de baas al na zes weken vragen of we klaar waren en waarom niet. Het moet sneller, maar ik houd wel vast aan een wetenschappelijke cultuur van grondige studie en zelfsturing vanuit inhoudelijke motivatie.” Toch werd Klous even benauwd dat zijn collega’s die hij overtuigde om Cern te verruilen voor KPMG, ontevreden zouden raken. “Ze waren 60 terabyte per seconde aan data gewend, dat vinden die jongens gaaf. In het begin klaagden ze: ‘Sander, we willen geen Cesna’s bouwen, maar Boeings.’ We groeien met steeds grotere toepassingen stap voor stap naar het niveau van de Boeings.”
Bovendien verbinden KPMG-specialisten zich weer wetenschappelijk. Klous zelf is net benoemd tot Hoogleraar Big Data Ecosystems aan de Universiteit van Amsterdam. Een NWO-project van de UvA in samenwerking met onder meer KPMG, Intel India, TNO, Vodafone, Surfsara, Prime Data en Indiase bedrijven is net goedgekeurd.
In UvA-verband gaat Klous onderzoeken of je duurzamer maatschappelijke evenwichten kunt bereiken met praktische toepassing van big data. “Ik wil effecten meten en begrijpen in de praktijk. Anders wordt het teveel zwarte kunst. Een interessant voorbeeld is de recente aankondiging van ‘voorwaardelijk geld’. Geld dat op je rekening wordt gestort, maar dat alleen voor bepaalde doelen kan worden gebruikt, of juist niet voor bepaalde doelen. Leuk bij zakgeld voor de kinderen, maar wat voor systemen kunnen daar nog meer mee worden gebouwd?”
Op z’n kop zetten
Data-analyse is al vaak, vooral in marketing, als heilige graal gezien voor kennis. Iedere keer was dat tevergeefs. Lost big data de grote beloften nu wel in? Klous verklaart zijn geloof: “Dit wordt veel fundamenteler. Nieuwe toepassingen kunnen echt de hele maatschappij op z’n kop gaan zetten. Zo kun je op grond van luchtvochtigheid, CO2, temperatuur, de lichtsterkte binnen en die van buiten met ervaringscijfers het ziekteverzuim voorspellen en verminderen. Zelfde laken een pak voor productiviteit. Begin eenvoudig. Deze vergaderkamers zijn bijvoorbeeld continu volgeboekt, maar toch staat momenteel de helft leeg. Rara, hoe kan dat?” Klous noemt ook de projecten van Heijmans en Daan Roosegaarde in wegenverlichting. “Slimme verlichting is nog maar het begin. Met een paar slimme Bluetooth sensoren van een tientje in de vangrail kun je precies snelheden en doorstroming meten. Want vrijwel elke passerende auto heeft wel een mobiele telefoon met Bluetooth aanstaan. De verkeersinformatiedienst (VID) doet dat al. Combineer dat met weersinformatie en je kunt het oponthoud in het verkeer minimaliseren.” TU Delft probeert met optimalisatie van stoplichten in de stad de toestroom van auto’s op de snelwegen te sturen. “Je kunt de herkomst van auto’s in de file nu exact vaststellen. Uiteindelijk realiseer je optimale collectieve reistijd in plaats van dat iedereen voor eigen gewin gaat.” Er zijn al tests gaande om op afstand met standaardsensoren de bewegingen van auto’s uit te lezen teneinde gaten in de weg te traceren. Dat helpt de planning van lokaal onderhoud. Ook kun je de invloed van rijgedrag op onderhoudskosten van auto’s en op het aantal ongelukken in kaart brengen. Klous: “Big data bieden de boeiendste toepassingen bij het combineren van heel verschillende bronnen.”
Privacy
Privacy is het heetste hangijzer van ‘dikke data’. Angst heerst. Zo trok KPN zich drie dagen voor de Koninginnedagtest vorig jaar terug uit vrees voor publieke toorn. Vodafone sprong in het gat. Klous: “We lopen vaker aan tegen vigerende meningen in de maatschappij over privacy dan tegen wettelijke problemen. Je moet kristalhelder maatschappelijke voordelen en/of het profijt voor klanten en/of klanten van klanten schetsen. Anders komt het verzet als een boemerang terug.” Over het algemeen is het prima mogelijk om data te anonimiseren voordat analyses worden uitgevoerd, dus geen nummers, kentekens, namen en herleidbare data vastleggen. Vragen opdrachtgevers toch om data op persoon te verzamelen, dan is daar toestemming voor nodig. Klous is strikt: met bedrijven die daar niet aan voldoen, doet hij geen zaken. “Bij het meten van locaties in gebouwen bijvoorbeeld, eisen we dat mensen die niet mee willen doen zich heel eenvoudig af kunnen melden.” Bijvoorbeeld door simpelweg hun telefoon in de buurt van een paal in de hal te houden waarna die niet meer wordt getraceerd. Het risico dat iedereen zich dan afmeldt, omdat ze niet willen dat hun frequentie en duur van koffie halen wordt gemeten, valt erg mee. Klous: “In een eerste test bij een congres van onze oud Cern collega’s in Amsterdam wilde 1 op de 1.000 bezoekers niet meedoen.”
Naast het anonimiseren van data voordat die binnenkomen, hanteert KPMG ook een zogeheten ‘randomizer’ die het onmogelijk maakt om kleine groepen of individuen te traceren. “Zo wordt bijvoorbeeld voorkomen dat we kunnen zien dat twee collega’s een paar keer per week lang ‘overwerken’ en dan samen vertrekken.”
Niet herleidbaar
Maar je kunt meer doen. Zo kun je tijdens Koningsdag in kaart brengen waar concentraties zijn van jongemannen tussen 18 en 25 jaar, de potentieel grootste risicogroep. Je kunt zelfs concentraties van personen met een strafblad etaleren. Heineken deed testen met flessen met een Wi-Fi-chip. De vraag is alleen of je mag proberen om overmatig drankgebruik vast te stellen in groepen of zelfs personen. Of mag je personen traceren met een verleden van extreem veel straatgeweld, ter bescherming van de feestvreugde van ‘ons’, het publiek?
Juridisch gezien mogen gegevens niet herleidbaar zijn naar een persoon.
In de Tweede Kamer en door het CBP is aangegeven dat een opt-in nodig is voor het in kaart brengen van persoonlijke patronen in de openbare ruimte, zoals een straat of een plein. In bijvoorbeeld winkelcentra of op gesloten evenementen is een opt-out voldoende. Klous: “Het identificeren van risicogroepen in de openbare ruimte zal vermoedelijk felle polarisatie opleveren tussen voorstanders van privacy en van veiligheid. Dit soort toepassingen vermijden wij liever zolang dat debat niet is uitgewoed. Bij gesloten evenementen vind ik het geen probleem, want daar kun je mensen goed informeren over hoe ze zich kunnen afmelden voor tracering.”
Transparante discussie
Privacy-zorgen fluctueren enorm, waarbij vaak afwegingen van persoonlijk profijt meespelen, zoals bij ‘gratis’ diensten als Facebook en Google, de big data keizers. Klous: “Ik ben het met je eens dat privacy vaak op een dubbele moraal is gebaseerd. De ene keer schreeuwen mensen moord en brand terwijl ze een volgende keer stilzwijgend genieten van de voordelen ervan.” Zo komt de privacy-angst in de zorg volgens hem vooral voort uit de vrees voor verlies van solidariteit. “Dat komt omdat we ons verzekeren tegen ziekte. Als verzekeraars gezondheid gaan verzekeren, krijg je een andere discussie.” Misschien moeten we straks na big data analyses bewijzen dat een kwaal genetisch bepaald is en geen gevolg is van een onverantwoorde levensstijl. “Ik ben geen ethicus, maar we lopen tegen die grenzen aan. In ieder geval moeten we de discussie transparant maken en houden.”
Klous vindt de maatschappelijke voordelen van big data minstens zo belangrijk als de verzekeringsvraag. Zo begint KPMG een project met een verzekeraar, artsen en een vereniging van epilepsiepatiënten. “Hopelijk vinden we met data over medicijngebruik en over de combinatie van epilepsie met andere kwalen bij veel patiënten correlaties en misschien zelfs causaliteit.” In een latere fase zullen data van metingen worden toegevoegd, die epilepsiepatiënten zelf leveren, zoals over voedselpatronen en lichaamsbeweging. “Een gemiddelde specialist heeft vijf uren per jaar contact met een patiënt. Die andere 5.000 uren dat een patiënt wakker is, kan data die worden gemeten met apps en sensoren het gat vullen.”
KPMG uitdaging
Net als individuen moeten ook bedrijven leren omgaan met het Google-tijdperk. “We groeiden op in een wereld waarin je voor kennis van een beperkt aantal personen afhankelijk was, ouders en docenten,” aldus Kous. “Inmiddels kun je over talloze bronnen beschikken met een muisklik. Die zijn lang niet alle betrouwbaar, maar toch leer je daar beslissingen op baseren. Ik ben nog geen bedrijf tegengekomen dat met de nieuwe databenadering en de bijbehorende onzekerheden goed kan omgaan.”
Dat was één van de redenen voor Klous om er samen met Nart Wielaart een boek over te schrijven. Wij zijn big data. De toekomst van de informatiesamenleving poogt lezers vertrouwd te maken met de nieuwe realiteit en mogelijkheden van dataverzameling. Daarnaast beschouwen de auteurs kritisch negatieve waarden inzake privacy en beperkte visies (filter bubble).
Vreemde eend
Ook binnen KPMG met het klassieke uurtje-factuurtje-model is de big data dienst een vreemde eend in de bijt. Klous wil producten bouwen die meermaals kunnen worden verkocht. In 2015 verwacht hij het winstniveau van KPMG te halen, in 2016 meer dan het gemiddelde. Klous wil tevens internationaal scoren om zijn team tevreden te houden. “Maar KPMG is nog niet zo goed ingericht op het internationaal benutten van gespecialiseerde teams. Om als Nederlands team commercieel succes te behalen met bijvoorbeeld KPMG US is niet eenvoudig.” Ook wil Klous nog wel iets kwijt over het gedrag binnen KPMG, wat overigens ook voor banken geldt: “Dit bedrijf heeft in de afgelopen periode niet echt heel goed gefunctioneerd en er wordt het nodige geroepen over verkeerde beloningen en stimulering van partners. Met big data kun je wellicht beter in kaart brengen waar het mis gaat en op individueel niveau de juiste prikkels aanbrengen. Op die manier lukt het misschien beter om duurzame evenwichten te creëren door gewenst gedrag op de juiste manier te stimuleren”.
Bedrijf voor lokalisering met big data
CrumbBase (kruimelbasis) is de naam van een startup van teleocmbedrijf Optinet, die zich specialiseert in big data op basis van lokalisering. Net als Kleinduimpje die de weg vond met kruimels, zo gaat CrumbBase bewegingen van groepen personen in kaart brengen. “Die analyses zijn niet eenvoudig,” vertelt Sander Klous, “en uiteraard moeten we op een verantwoorde manier met privacy omgaan. Mijn big data team helpt ze daarbij.”
KPMG borduurt voort op haar eerste bekende toepassing, de ‘druktemeter’ van Amsterdam op Koninginnedag 2013. Op www.waarisdekoning.nl en via www.nu.nl was grafisch real-time de omvang en verspreiding van de mensenmassa’s te zien. De bron bestond uit samengevoegde locatiegegevens van mobiele telefoons.
Ook het genoemde NWO-project met Indiase bedrijven en Vodafone heeft telefoonlocaties als uitgangspunt. Ruimtelijke ordening en veiligheid in Indiase steden moet profiteren van verkeersmetingen op basis van telefoonlocaties. Klous: “In Amsterdam ging het om het vermaak van de toepassing en of bezoekers hun biertje nog wel konden halen. Maar in India kun je de planning voor nieuwe infrastructuur veel nauwkeuriger maken, zodat het ‘crowd management’ beter wordt. Dit kan uiteindelijk zelfs het dooddrukken van mensen in massa’s voorkomen.”
Ook in winkelcentra kan CrumbBase aan het werk, waar meten de plaats inneemt van navragen en enquêteren. Een mondiaal grootwinkelbedrijf wordt de eerste klant. Optimalisatie dankzij data binnen winkels kan de dienstverlening helpen verbeteren, weet Klous: “Aan de hand van drukte kun je de bezetting van kassa’s aanpassen en wachttijden verminderen. Met routeinformatie van klanten kun je schapindeling en inzet van medewerkers optimaliseren. Meten wanneer welke producten hoe lang worden bekeken en welke factoren tot kopen leiden geeft operationele voordelen.” Het systeem in winkels werkt met opt-out: wie bij binnenkomst z’n mobiel bij een paal houdt wordt niet gevolgd. Aan de winkelketen de opdracht om klanten niet te irriteren en dat ze ongestoord kunnen winkelen zonder dat Big Brother mee rijdt in hun boodschappenwagen.
Financiële risico’s fors verminderen
Volgens Klaus behaalt KPMG het meeste succes met big data bij banken en verzekeraars. De analyse van hun portefeuilles levert veel meer inzicht op in winstpotentie en vooral in risico’s. Hij noemt als voorbeeld de risico’s bij het vaststellen van hypotheekportefeuilles. Traditioneel koppelen banken dat aan individuele inkomens van klanten, maar met externe data over vraag- en verkoopprijzen, afkomstig van bijvoorbeeld Funda en het kadaster wordt duidelijk welke woningen ‘onder water’ staan. “Daaruit blijkt dat het risico in de huidige markt veel groter is dan op grond van louter eigen data kan worden ingeschat.”
Voor een Taiwanese bank rondde KPMG onlangs een project af om de marketing voor creditcards te verbeteren. Het percentage gebelde klanten dat terugkeerde als klant steeg van 16 tot 53 procent, een enorme verbetering waar Klous direct een kanttekening bij plaatst: “De meeste klanten die als afhakers te boek stonden, waren personen die de kaart van die bank maar één keer per jaar gebruikten voor het betalen van hun verzekering. Zodra we dat aspect filterden, waren we al een eind op weg. Juist voor deze klanten had het spammen met aanbiedingen helemaal geen zin. Echte toegevoegde waarde bieden had dat wel.” Zo stuit KPMG bij financiële instellingen met regelmaat op merkwaardige veronderstellingen die vaak vooral ongemak opleveren voor klanten. Door verborgen correlaties en zo mogelijk causaliteit aan het licht te brengen kunnen diensten veel beter worden afgestemd op de wensen. “Men is al te vaak pennywise en poundfoolish met als gevolg hogere financiële risico’s voor de instelling en ongemak voor de eindklant.”