VKA voorspelt kabinetsformatie met behulp van data-analyse

VKA (Verdonck, Klooster & Associates) heeft op basis van de verkiezingsprogramma’s en de laatste opiniepeiling van Ipsos voorspeld wat de meest waarschijnlijke kabinetsformatie wordt na de verkiezingen. Het ziet ernaar uit dat er een kabinet komt van maar liefst vijf partijen die samen 83 zetels hebben. Het wordt het vierde kabinet Rutte, dat een ferme ruk naar links maakt.

De Christen Unie is met 5 zetels niet nodig voor de meerderheid, maar dat is wél de partij die de verbinding legt tussen het iets rechtsere programma van de VVD en de wat linksere standpunten van de andere drie beoogde coalitiegenoten: D66, PvdA en GroenLinks. De ChristenUnie laat ook de grootste correlatie zien met de VVD.

Text mining maakt correlatie helder

VKA komt tot deze voorspelling door text analysis (ook wel text mining genoemd) toe te passen op de verkiezingsprogramma’s van de verschillende partijen. Met deze methode is het mogelijk om snel waardevolle informatie te halen uit grote hoeveelheden teksten.

VKA heeft in zijn analyse gekeken hoe vaak bepaalde woorden, en synoniemen van die woorden, voorkomen in de verkiezingsprogramma’s. Omdat de lengte van de verkiezingsprogramma’s verschilt van één A4 tot tientallen pagina’s, is voor de lengte een correctie toegepast. In deze analyse komt duidelijk naar voren op welke verkiezingsthema’s de verschillende partijen zich willen onderscheiden en welke woorden ze daarbij gebruiken.

Correlatiematrix weerspiegelt ruk naar links

Door een correlatiematrix als visualisatie-instrument te gebruiken blijkt in één oogopslag dat sommige verkiezingsprogramma’s veel dichter bij elkaar liggen dan je op basis van partijprofilering zou denken. Zo zijn er veel overeenkomsten in de verkiezingsprogramma’s van de PvdA en VVD (een correlatiefactor van 0.76). En wat te denken van een correlatie van 0.73 tussen de Christen Unie en D66? Ze mogen dan op één of enkele thema’s lijnrecht tegenover elkaar staan, op de andere gebieden hebben ze ontzettend veel overeenkomsten.

De visualisatie maakt ook duidelijk dat de VVD naar het midden opschuift, door de relatief hoge correlatie met partijen die traditioneel links van het spectrum zitten, zoals PvdA, GroenLinks en D66.

Text mining toepassingen

Zoals gezegd is text mining een goede manier om snel informatie te halen uit grote hoeveelheden tekst. De toepassingsgebieden zijn groot: van snel de kernaspecten halen uit grote aanbestedingsdocumenten tot heldere samenvattingen maken van grote juridische dossiers.

 

Gerelateerde berichten...