Algoritmes van leken rukken op in Big Data analytics

De technologie van Big Data analytics is eigenlijk het probleem niet meer. Het vinden van goede toepassingen wél. ICT/Magazine bezocht diverse evenementen en ging op zoek naar businesscases.

Conferenties over big data analytics worden almaar beter bezocht. ICT/Magazine woonde dit najaar vier evenementen in Nederland bij en één in Orlando. Allemaal hadden ze tussen de 30 en 50 procent meer bezoekers dan vorig jaar. Wat overal opviel: er wordt nauwelijks nog gesproken over een tekort aan data scientists, wat tot voor kort nog een hot topic was. De reden: het gebruiksgemak van de software is zo groot geworden dat je ook zonder kennis van de technologie datasets kunt samenvoegen en complexe analyses kunt maken.

 

Een platform

Taken waar je voorheen nog verschillende applicaties voor nodig had, worden nu geïntegreerd op één platform. Bovendien is het ontwikkelen van algoritmen grotendeels geautomatiseerd, waardoor ook businessmensen met de software uit de voeten kunnen. “Wij hebben maar één doel en dat is gebruik van data democratiseren”, zegt Splunk CEO Douglas Merritt dan ook. “We willen de technologie zo eenvoudig maken dat iedereen in de business op basis van dezelfde data zijn eigen analyses kan maken.”

Naar dat doel is Splunk een eind op weg, maar dat geldt evengoed voor partijen als Talend, SAS, Informatica, Qlik, en voor Hadoop-distributiepartners als Hortonworks, Cloudera en MapR. Ze hebben verschillende ontstaansgeschiedenissen, spelen verschillende rollen in het ecosysteem, maar uiteindelijk hebben ze allemaal hetzelfde doel: ze willen hét data-integratieplatform in een organisatie worden. En ze realiseren zich allemaal dat dat alleen lukt als het samenbrengen van data écht eenvoudig is.

 

Machine learning

Eenvoudige data-integratie is één ding, maar het gaat uiteindelijk natuurlijk om de analyse. Ook dat wordt zo eenvoudig mogelijk gemaakt, onder meer door toepassing van machine learning, ofwel zelflerende algoritmes. In eerste instantie zullen mensen het algoritme moeten vertellen hoe een patroon eruit ziet en welke data afwijken van dat patroon. Snapt het algoritme dat relatief eenvoudige patroon, dan kan het zelfstandig data analyseren en alleen nog in geval van twijfel aan een mens vragen in welke categorie data thuishoort.

Splunk heeft het ontwikkelen van algoritmes zelfs zo eenvoudig gemaakt dat je je vraag in gewone mensentaal kunt ingeven. De software maakt daar zelf het algoritme bij. Voorlopig is dit alleen nog in het Engels beschikbaar. Aangezien deze software pas dit najaar beschikbaar komt, zijn er nog geen bedrijven die het al gebruiken. Wel zijn er legio klanten die erover fantaseren.

“Het zou geweldig zijn als ik gewoon tegen de software kan zeggen: hoe druk wordt het het komende uur bij de douane en de security? Waar gaan dan het eerst knelpunten ontstaan?”, zegt Chris Howell, Head of Business Systems van luchthaven London Gatwick.

Lees het hele verhaal online of in ICT/Magazine van december.