NFI leert computers berichten met doodsbedreigingen uit te filteren

beeldbellen videochat via laptop

Het Nederlands Forensisch Instituut (NFI) ontwikkelde een computermodel om de politie te helpen voorspellen welke berichten een serieuze doodsbedreigingen bevatten.

Het team voor Forensische Big Data Analyse (FBDA) van het NFI bouwde eerder al een computermodel om drugsgerelateerde berichten te herkennen in grote hoeveelheden berichten die verdachten aan elkaar stuurden. Vervolgens begon het team met vergelijkbare technieken aan een model om levensbedreigende berichten te herkennen. Dat model was klaar toen per 1 april de chats van Encrochat bij de politie in Driebergen binnenstroomden.

Vervolgens kon de politie uit die grote berg van 25 miljoen berichten de juiste onderscheppen. Als je die berichten handmatig wil doorzoeken, ben je wel even bezig. Het is zoeken naar een speld in een hooiberg. Dat terwijl in het geval van berichten met doodsbedreigingen haast geboden is.

Deep Learning

Hoe doe je dat? Deep learning is een verzameling technieken waarmee je computers taal kunt leren herkennen. Zulke modellen lijken qua structuur op het menselijk brein. Ze worden daarom ook wel ‘neurale netwerken’ genoemd. De modellen leren op een vergelijkbare manier als mensen. Namelijk door heel veel voorbeelden te bekijken.

Zulke modellen krijgen in dit geval eerst trainingen op generiek taalbegrip door ze bijvoorbeeld krantenartikelen of Wikipedia te laten lezen. Het taalgebruik in kranten en op Wikipedia is natuurlijk anders dan de manier waarop criminelen met elkaar communiceren. Om ook dat specifieke taalgebruik te leren begrijpen, moeten de deep learning-modellen nog even doorleren. Dit gebeurt door ze specifiek taalgebruik te laten zien.

Afknallen

Medewerkers van het NFI hebben met politierechercheurs woordenlijsten gemaakt met ‘signaalwoorden’. Dat zijn woorden die criminelen kunnen gebruiken bij (plannen van)  mishandelingen, ontvoeringen of moorden. Ze gebruiken bijvoorbeeld de woorden ‘dood’, ‘slapen’, ‘poppen,’ ‘afknallen’, ‘verdwijnen’, etc.

Voor het maken van de woordenlijsten maakten de bouwers van het systeem ook gebruik van historisch materiaal. Die kwam er in samenwerking met Europol en zo kwam er een zelfde lijst in zowel het Frans als Engels.

De politierechercheurs gaven de resultaten vervolgens het label ‘bedreigend’ mee of het label ‘niet-bedreigend’. Het woord ‘slapen’ kan bijvoorbeeld ook heel goed in een niet bedreigende context staan. Wanneer je met alleen dat woord zou zoeken, krijg je ook veel berichten die niet relevant zijn. Dat wil je niet. Daarom kregen de computers via de labels training om uit de context af te leiden of het daadwerkelijk om een bedreiging of zelfs doodsbedreigingen gaat.

Miljoenen zinnen invoeren

Medewerkers van het NFI voerden zo tienduizenden bedreigende en niet-bedreigende zinnen in. De politie zette het model vervolgens in om de berichten met een hoge kans op een levensbedreigende inhoud te herkennen. De resultaten werden gecheckt en dat materiaal kon ook weer gelabeld worden en opnieuw ingeladen. Zo werd de computer steeds slimmer.

Het model geeft nooit 100 procent garantie dat het klopt. De computer helpt de mens bij het zoeken. Een algoritme kan dingen missen, zogenoemde ‘blind spots’. Het is belangrijk dat de gebruikers van het model zich daarvan bewust zijn. Bij het nemen van een beslissing maakt niet de computer maar een mens deze beslissing. Het model geeft ieder bericht een cijfer tussen de 0 en de 1 mee. Hoe dichter bij de 1, hoe groter de kans dat het om een bedreigend bericht gaat. Na beoordeling beslist de politie of er actie nodig is of niet.

Na de ontwikkeling van het model heeft de politie het nu in gebruik. Die richtte een speciaal Threat To Life-team (TTL) in. Dit team doorzocht de berichten die bij de politie binnenkwamen op levensbedreigende situaties en doodsbedreigingen met behulp van het NFI- model. Tientallen personen werden volgens de politie gewaarschuwd. Niet alleen omdat ze geliquideerd zouden gaan worden, maar ook vanwege mogelijke zware mishandeling of ontvoering.

Lees ook:

Gerelateerde berichten...

X