Kredietverstrekker Floryn gebruikt machine learning-modellen om analisten razendsnel een aanbeveling te doen voor het wel of niet verstrekken van een zakelijke lening. Volgens Chief Technical Officer (CTO) Marijn van Aerle werkt het bedrijf niet alleen veel sneller dan banken, maar blijven de adviezen zo ook nog eens gevrijwaard van ingebakken vooroordelen.
“Wij zeggen binnen 24 uur ja of nee tegen een aanvraag van een ondernemer”, aldus CTO Van Aerle. “Hoewel iedereen natuurlijk liever een ‘ja’ hoort, is het ook waardevol om niet te lang op een negatief antwoord te hoeven wachten. Een aanvrager kan dan namelijk snel op zoek naar een alternatief, of schaven aan het businessmodel.”
Het idee achter Floryn is dat het proces om krediet te krijgen veel sneller verloopt dan bij traditionele banken. Het bedrijf heeft inmiddels meer dan 331 miljoen euro aan leningen verstrekt aan zo’n 5000 bedrijven. Dat zijn met name midden- en kleinbedrijven (mkb). De leningen, variërend van enkele tienduizenden euro’s tot maximaal 3 miljoen, komen ten goede aan investeringen waarmee een bedrijf kan uitbreiden, benodigde materialen kan aanschaffen of de dienstverlening kan opschalen.
Het geld voor die leningen komt veelal van ‘vermogende individuen’ die vaak zelf ondernemer zijn (geweest) en een deel van hun geld graag in kansrijke initiatieven steken. De eerste geldschieter die tekende was de bekende Kalo Bagijn, oprichter van onder meer BinckBank en BrandNewDay. Inmiddels zijn ook ‘reguliere’ banken aangehaakt: aanvankelijk NIBC, later kwam daar het Britse NatWest voor in de plaats.
Banktransacties als basis
Waar de meeste traditionele kredietverstrekkers afgaan op accountantsgegevens, speurt Floryn door banktransacties. “De boekhouder hoeft er dan niet tussen te zitten”, aldus Van Aerle. “Dat scheelt heel wat schijven, want er hoeft heel wat minder papierwerk rond geduwd te worden van de aanvrager naar een accountant, naar de bank en weer terug.”
De software die Floryn gebruikt, is zelf gebouwd om de aangeleverde data te verwerken. Het checkt waar een bedrijf z’n geld aan uitgeeft, welke transacties van of naar bepaalde klanten of leveranciers gaan, of dit terugkerende transacties zijn of slechts één keer plaatsvinden, welke omschrijvingen erbij staan vermeld en andere datapunten die iets zeggen over het reilen en zeilen van een bedrijf.
“Toen we hiermee begonnen, was dit voornamelijk nog mensenwerk. Ook toen al hadden we een voorsprong qua snelheid op traditionele banken. Inmiddels zijn we een aantal jaar verder en is één en ander verregaand geautomatiseerd.”
Het vaststellen van de kredietwaardigheid van een bedrijf gebeurde in de beginfase van deze digitalisering bij Floryn op basis van eenvoudige algoritmes, vertelt Van Aerle. “Als de omzet een x bedrag is en voorwaarde y en z klopten, dan gaf het algoritme een positief advies”, vat hij vereenvoudigd samen hoe het toen ging.
Steeds meer patronen waarnemen
Allengs kwamen er steeds meer engineers bij om deze klus verder te automatiseren. Van Aerle: “Als je steeds meer data verzamelt, kun je ook steeds meer patronen waarnemen. Daar kun je machine learning op loslaten. Dat is dan ook waar we enkele jaren geleden mee zijn begonnen.” Volgens de CTO kan Floryn bogen op een indrukwekkend track record en hoeft het bedrijf slechts 1 procent van de verstrekte leningen af te schrijven. Sinds dit jaar is het bedrijf winstgevend.
Degene die de lening aanvraagt, moet Floryn natuurlijk eerst toegang geven tot die gegevens. “We staan onder toezicht van De Nederlandsche Bank, die controleert of we ons aan privacy- en security-vereisten houden. Daar zijn we ook blij mee, want we zien dat als een kwaliteitsstempel. Compliance is alles voor ons, het zegt veel over onze betrouwbaarheid. Niet voor niets hebben we twee compliancemedewerkers.”
Wie het tegenwoordig over AI heeft, denkt al snel aan de grote taalmodellen (LLM’s) als GPT, Llama en Claude. Daar maakt Floryn zeker volop gebruik van? “Eigenlijk niet”, zegt Van Aerle. “Kijk, we experimenteren er intern wel eens mee, maar het gebruik van een LLM voor ons werk is helemaal niet voor de hand liggend. Wij willen vooral veel weten over cijfers, en LLM’s zijn gespecialiseerd in taal. Het zit ‘m al in de naamgeving, de tweede L van LLM staat immers voor ‘language’. Wij gebruiken dus wel machine learning en passen deep learning toe, maar maken geen specifiek gebruik van LLM’s.”
Grote hoeveelheden data verwerken
Voor de goede orde: machine learning behelst het trainen van computermodellen met data om quasi-autonoom voorspellingen te doen, beslissingen te nemen of patronen te herkennen. Deep learning (waar je LLM’s onder kunt scharen) betreft een subveld dat gebruik maakt van complexere en krachtiger modellen, geschikt voor de verwerking van grote hoeveelheden ongestructureerde data zoals afbeeldingen, tekst en geluid.
LLM’s zijn met name goed in het begrijpen en genereren van natuurlijke taal. “Maar”, stelt Van Aerle “je zou tussen al het LLM-geweld dat tegenwoordig de media domineert, vergeten dat er ook nog ‘gewone’ machine learning-modellen bestaan die heel goed zijn in waarvoor ze zijn gemaakt.”
“Dankzij de door ons gebruikte modellen zagen we bijvoorbeeld dat patronen tijdens de corona-pandemie veranderden. Daar konden we toen op inspelen om niet allerlei valse positieven te krijgen”. Hebben de gebruikte modellen bijzondere of opvallende patronen gevonden die zich niet zo makkelijk laten verklaren, dan sturen ze die door naar een menselijke medewerker.
“Uiteindelijk blijft altijd een mens van vlees en bloed verantwoordelijk. Die geeft ook de motivatie achter een afwijzing”, vervolgt Van Aerle. “We zeggen niet alleen ‘computer says no’, maar willen ook graag dat een bedrijf weet waarom de aanvraag niet is goedgekeurd. Daar hebben ze meer aan, en zo kunnen ze eraan werken om een volgende keer juist wél voor een lening in aanmerking te komen, bij ons of elders.”
Door de bomen het bos zien
De CTO wijst er ook graag op dat de gegevens die bedrijven aanleveren, veilig gehost blijven in een Europees datacenter van AWS. “We hebben speciale contracten die samenhangen met onze vergunning, ook gebruiken we die data niet voor het trainen van foundational models [grote, algemene machine learning-modellen]. We bouwen alles namelijk zelf. Daarvoor gebruiken we gerichte modellen, zoals regressiemodellen, Support Vector Machine (SVM), gradient boosting en random forest.”
Wie zich afvraagt wat deze modellen precies doen met de schat aan informatie die leningzoekers aanleveren: regressiemodellen zijn onder andere bruikbaar voor prijsvoorspellingen, SVM voor het verdelen van data in groepen (bijvoorbeeld op basis van een scan van een reeks uitgaven). Gradient boosting verbetert voorspellingen door een reeks beslisbomen op te bouwen, waarbij elke volgende boom de fouten van de vorige bomen corrigeert.
Random forest tenslotte, is als een bos vol van zulke beslisbomen: elke boom analyseert een deel van de data en maakt een voorspelling. Door al die bomen samen te laten werken, ontstaat een nauwkeurig en robuust beeld van het gehele ‘bos’. Het zorgt er dus eigenlijk voor dat Floryn door de bomen het bos kan zien.
Geen vooroordelen
Om ervoor te waken dat de modellen gevrijwaard blijven van bias, ofwel ingebakken vooroordelen, heeft Floryn ze laten toetsen door onderzoeksinstellingen zoals de TU Eindhoven en Hogeschool Utrecht. Dit om ervoor te zorgen dat de modellen transparant en eerlijk tot een ‘oordeel’ komen. Volgens het bedrijf zelf toont interne data bijvoorbeeld aan dat de modellen mannelijke en vrouwelijke ondernemers gelijk beoordelen –in elk geval niet negatiever staan tegenover een vrouwelijke ondernemer.
“Het bouwen en constant ontwikkelen van deze modellen is voor ons heel waardevol, maar de uiteindelijke mens-machine loop is voor ons het meest waardevol”, besluit Van Aerle. “AI vereist heel veel inrichting aan de voorkant en constante ontwikkeling daarna. Ons ontwikkelteam van software-engineers, datawetenschappers en data-analisten zorgt ervoor dat de beveiliging van de infrastructuur op orde blijft en dat onze systemen opschalen naar gelang de hoeveelheid data groeit.”
“Ook optimaliseren onze experts de gebruikerservaring, waaronder het wegnemen van bias. Dat samenspel tussen onze mensen en de machine learning-modellen, daar zit voor ons het goud. Een model kan weliswaar heel goed data doorgronden, maar nieuwe ideeën bedenken voor het toevoegen van relevante dataknooppunten, dat doet de mens.
Lees ook: Waarom de vrouw ondervertegenwoordigd is in technologie