9min Security

Big data en moraliteit

Big data en moraliteit

To big data or not to big data? That is the question

Big data heeft vele gezichten. De meeste daarvan worden getoond in het technische domein, maar er is meer. Hoe gaan organisaties als Google en Facebook om met de onwaarschijnlijke hoeveelheden data die zij van ons verzamelen? Om nog maar te zwijgen van een club als de NSA. In het kielzog van het enorme potentieel van big data drijft de kwestie van de moraliteit.

Zoals alles heeft ook big data een verleidelijke kant en een beangstigde kant. De verleiding zit hem in de belofte die zoveel mogelijk data in zich draagt. We willen als bedrijf het liefst alle gegevens hebben van klanten. Hoe beter we het gedrag en het denken van onze klanten begrijpen, hoe beter we onze producten op zijn maat kunnen maken. Met als logisch gevolg dat we voorop blijven lopen in het verkrijgen van de gunst van de klant. De angst bestaat uit het schrikbeeld dat we de boot missen als we niet investeren in big data. Aan de andere kant van het spectrum vinden we het als consument en gebruiker niet prettig dat bedrijven zomaar de beschikking krijgt over onze persoonlijke gegevens. Het is niet zo vreemd dat de roep om bescherming van onze privacy alleen maar luider een veelvuldiger klinkt. Tegelijkertijd willen we wel gebruik kunnen maken van de persoonlijke bonuskaartaanbiedingen.

De non-persoon
De discussie omtrent de mogelijkheden van big data in relatie tot het moreel juiste gebruik ervan staat nog maar aan het begin. En dat deze discussie gevoerd moet worden, staat buiten kijf. Big data ‘is here to stay’ en zal zich alleen nog maar uitbreiden. We zullen moeten accepteren dat iedereen – of eigenlijk zou je moeten zeggen: niemand in het bijzonder – informatie over ons kan verkrijgen. Mensen die wij niet kennen en aan wie we zelf waarschijnlijk niets over onszelf zouden vertellen – zeg maar: een non-persoon – kan wroeten in ons privéleven. De discussie zou dan ook niet meer moeten gaan over de vraag of we gebruik willen maken van big data, maar eerder hoe we omgaan met de uitwassen die big data met zich meebrengt. Dankzij big data is de non-persoon op de hoogte is van mijn geloofsovertuiging, terwijl mijn buurvrouw dat niet eens weet. Ook weten volstrekt onbekenden dat ik heimelijk droom over een homoseksuele relatie, iets wat ik voor mijn eigen partner angstvallig verborgen houdt. Of die non-persoon – wat ook een instantie kan zijn als een zorgverzekeraar – is ‘ter ore gekomen’ dat ik al verdacht lang gezondheidsklachten heb, maar een bezoek aan de dokter zolang mogelijk uitstel.

Toegeven aan verleiding
Ook wordt reclame ongevraagd afgestemd op onze gegevens. Volgens de een helpt ons dat juist in het maken van betere keuzes, een ander meent dat we moeilijker weerstand kunnen bieden aan de verleidingen die ons allemaal worden aangereikt. Uit mijn surfgedrag kunnen non-personen zonder al teveel analyseerwerk destilleren dat ik dolgraag op wintersport zou gaan. De aanbiedingen naar sneeuwrijke en idyllische oorden vliegen me dan ook om de oren. Hoewel mijn financiële en huiselijke situatie het onmogelijk maken, kost het me erg veel moeite niet toe te geven aan de verleiding. Ik moet erg sterk in mijn gedroomde skischoenen staan om de ‘nu-of-nooit-aanbiedingen’ naast mij neer te leggen.

Onze eigen moraliteit
Van big data hoeven we geen moraliteit te verwachten. Het doel van big data is om onze producten te verbeteren en eenvoudiger aan de man te brengen. Er zit dus niets anders op dan als consument te leren om beter opgewassen te zijn tegen de grote verleidingen die big data over ons heen zullen strooien. Als werknemers moeten we onze eigen moraliteit goed in de gaten houden. We kunnen ons maar ten dele verschuilen achter een façade van bedrijfspolicy. Want iedere ochtend moeten we nog wel naar onszelf kunnen kijken in de spiegel. Zoals we te allen tijde zelf verantwoordelijk zijn voor ons handelen, zo zijn we ook verantwoordelijk voor hoe we de verkregen data gebruiken en hoe we de data inzetten. Het is bijvoorbeeld mogelijk – zoals dat ook kan met andere vormen van statistiek – om met de verkregen gegevens conclusies te manipuleren. Ieders moraliteit zou dus geschoold moeten worden, om de data in te zetten in dienst van het belang van de klant, zoals door het verbeteren van producten. Wanneer de data alleen gebruikt wordt ten koste van de klanten, met als enig doel om op korte termijn hogere omzetten te genereren, zal de klant voelen dat hij in de maling is genomen en het bedrijf de rug toekeren.

De werkelijke kracht
Door ons surfgedrag of koopgedrag in kaart te brengen en daar allerlei correlaties in aan te brengen, maken big data ons onderbewuste zichtbaar. Van deze correlaties zijn we onszelf zelden bewust. Kennis van deze onbewuste verlangens is een zeer effectieve grondstof voor reclamedoeleinden. Hoe onbewuster het gedrag is wat we vertonen, hoe beïnvloedbaarder wij zijn. De morele vraag die we bij big data moeten stellen is dus: Mogen we het onbewuste zodanig beïnvloeden dat we klanten ertoe bewegen dat ze doen wat wij willen? Menig bedrijf zal hier onomwonden ‘Ja’ op antwoorden. Maar velen zullen vanuit persoonlijke motieven ‘Nee’ beantwoorden. Merkwaardig eigenlijk dat de mensen bij die bedrijven menen dat ze de klant wel kunnen aandoen, waarvan ze zelf zeker niet willen dat een ander hen dat aandoet. De kernvraag die deze mensen zouden moeten stellen is: vinden mensen, onze klanten, het prettig om onbewust beïnvloed te worden? Zouden ze het niet prettiger vinden om bewust voor een bepaald product te kiezen? En als die laatste vraag met ‘Ja’ wordt beantwoord, hoe help je de klant dan met big data om tot deze bewuste keuze te kunnen komen? Big data kan inzicht geven in allerlei verschillende correlaties tussen schijnbaar losstaande gebeurtenissen. Het in kaart brengen van deze losstaande gebeurtenissen, de correlaties daartussen te vinden en dan samen met de klant achter ‘het waarom’ van deze correlaties komen, daar ligt de werkelijke kracht van big data. Door samen met de klant op zoek te gaan naar diens werkelijke wensen, kan hij bewust een keuze maken in zijn volgende stap. Hij is daarmee veel meer geholpen dan met het oprakelen van onbewuste verlangens. Het scholen van ieders moraliteit kan evenwel nog wel eens een zware dobber worden. Want als we hier de sleutel al van hadden gevonden, was de deur naar een utopische maatschappij al lang geleden wagenwijd opengezet.

Snelcursus big data
Wanneer is het nu big data en wanneer niet? Als we data verzamelen en analyseren, wanneer is er dan genoeg data om van big data te mogen spreken? Of is big data niets meer dan een modewoord dat we hebben bedacht om Business Intelligence en Analytics nieuw leven in te blazen en doen we eigenlijk niets nieuws? Bij de traditionele data-analyses vanuit onze transacties en het datawarehouse ligt de nadruk op het gestructureerd opslaan en verwerken van de data. De kwaliteit van de data en de consistentie is zeer belangrijk. Vandaar dat de processen en de programmatuur veel controles bevatten om te zorgen dat de kwaliteit hoog is. Als er tijdens het verzamelen van de data iets fout gaat, stopt de programmatuur zodat de data kunnen worden aangepast en de kwaliteit optimaal blijft.

Bij big data is de invalshoek anders. We maken ons minder druk om de kwaliteit van de data en we passen minder controles toe, omdat we trends willen ontdekken. De programmatuur die bij big data wordt gebruikt, is vooral robuust gebouwd. Gaat er bij het verzamelen van de data iets fout dan blijft de programmatuur doorlopen en stopt de verwerking niet. De kwaliteit van de data is dus lager, maar omdat we heel veel data hebben gaan we ervan uit dat de kwaliteit hoog genoeg blijft dankzij de kwantiteit.

Bij big data gaat het volgens Gartner om de drie V’s: Volume (de hoeveelheid data), Velocity (de snelheid waarin de data wordt aangeboden) en de Variance (de verschillende soorten en typen data die gezamenlijk verwerkt worden). Als één of meer van deze V’s aanwezig is dan is traditionele programmatuur niet meer in staat om de data te verwerken en worden big-data-toepassingen noodzakelijk. Big data geeft dus informatie op basis van heel veel, of razendsnel aangeleverde (bijvoorbeeld sensor-data) of hele verschillende en ongestructureerde gegevens (bijvoorbeeld twitter of google maps).

Technieken achter big data
De big data worden met verschillende technieken en tools verwerkt tot presentabele en analyseerbare vormen. Voorbeelden van die technieken zijn mapreduce, hadoop, cassandra enzovoort. Een voorbeeld van een viewer die gebruikmaakt van big data is Ngrams van Google, waarmee je de ontwikkeling en het gebruik van woorden kunt analyseren. De viewer maakt gebruik van alle data die in Google Books staan. De big data zijn dan als het ware omgezet naar informatie die je kunt analyseren.

Heb je die informatie eenmaal tot je beschikking dan zijn er technieken om analyses en voorspellingen te doen. Er zijn veel technieken en algoritmes, de meest voorkomende zijn de decision tree, de neurale netwerken, de clustering, de nearest neighbor, de genetische algoritmen en de rule induction. We lopen ze even langs:

Bij de decision tree bouw je een beslisboom op vanuit de informatie die je hebt. Je kunt dan inzicht krijgen in de kans dat een bepaalde situatie zich wel of niet voordoet. Bij een neuraal netwerk kijk je naar de combinatie van een aantal factoren in de data en de resultaten die hierdoor ontstaan (voorbeeld: de kans dat iemand een lening wel of niet terugbetaalt). Bij clustering groepeer je informatie, zodat je per groep ontwikkelingen kunt inzien (voorbeeld: de huizenprijzen in Amsterdam stijgen sneller dan in de rest van Nederland). Bij de nearest neighbor ga je op basis van de informatie die je hebt voorspellingen doen over nieuwe ontwikkelingen (voorbeeld: mensen in een nieuwe Vinex wijk schaffen binnen een jaar een tweede auto aan van het merk Opel of Peugeot). Bij het genetische algoritme kijk je welke combinatie van informatie het meeste resultaat of succes geeft. Rule induction is een techniek die in de retail veel wordt toepast. Je kijkt dan naar combinaties van artikelen die gekocht (kunnen) worden (voorbeeld: iemand die kaas en stokbrood koopt, koopt meestal ook een fles wijn).

door: Herma Kan en Bert van der Zee
Bert van der Zee is consultant en trainer en is samen met Herma Kan auteur van het boek ‘Intuïtief Innoveren, Methodisch werken aan echte doorbraken met QuTE’.