DeepSeek lanceert wiskundig model voor complexe bewijzen

DeepSeek lanceert wiskundig model voor complexe bewijzen

Het Chinese DeepSeek heeft een nieuw AI-model uitgebracht dat zich richt op wiskundige bewijzen. DeepSeekMath-V2 kan niet alleen antwoorden geven, maar ook de redenering erachter controleren. Het model behaalde topscores op verschillendewiskundewedstrijden.

DeepSeek is een bekende speler op het gebied van de ontwikkeling van grote taalmodellen. Het bedrijf biedt hun modellen opensource aan, wat betekent dat andere partijen de software gratis mogen gebruiken. DeepSeekMath-V2 werkt anders dan eerder uitgebracht wiskundemodellen. Het controleert zijn eigen werk via een verificatiesysteem. Dat gebeurt door een zogenaamde generatie-verificatie-cyclus, waarbij het model eerst een bewijs opstelt en vervolgens zelf controleert of de gevolgde stappen kloppen.

Het bedrijf trainde een nauwkeurige ‘verifier’ voor het controleren van wiskundige bewijzen. Die verifier dient als ‘beloningsmodel’ voor een bewijsgenerator. De generator leert daardoor fouten in zijn eigen bewijzen op te sporen en op te lossen. Door deze werkwijze kan het systeem automatisch nieuwe, moeilijk te verifiëren bewijzen labelen. Dat levert dus weer trainingsdata op om de verifier verder te verbeteren.

Benchmarks: goede scores

DeepSeek toonde de capaciteiten van het model via internationale wiskundewedstrijden. Bij de International Mathematical Olympiad (IMO) 2025 behaalde het model een gouden score. Ook op de Chinese Mathematical Olympiad (CMO) 2024 presteerde het op dat niveau.

Bij de Putnam 2024-competitie scoorde DeepSeekMath-V2 118 van de 120 punten. Dat gebeurde met ‘scaled test-time compute’, waarbij het model meer rekenkracht krijgt tijdens het oplossen van problemen.

Lees ook: DeepSeek verboden voor Nederlandse ambtenaren

Potentie voor wetenschappelijk onderzoek

De lancering van dit model kan gevolgen hebben voor wetenschappelijk onderzoek. Beter begrip van wiskunde kan immers leiden tot doorbraken in gezondheidszorg en technologie. AI-bedrijven blijven zoeken naar methoden om wiskundige capaciteiten te verbeteren. Open toegang tot dit model versnelt die ontwikkeling. Voor technische details is er een research paper beschikbaar als PDF.

Meer informatie over het DeepSeekmath-V2-model is te vinden op GitHub en het model zelf is te downloaden via HuggingFace. De modellen van het Chinese bedrijf worden ontwikkeld tegen relatief lage kosten en er wordt gebruikgemaakt van een efficiënte architectuur. Voordelen daarvan zijn dat er minder rekenkracht gebruikt wordt dan bij traditionele modellen en ook werkt het sneller dan verschillende andere concurrerende modellen.