Contentmanagementsplatform Box heeft vandaag het eerder gepresenteerde Box Extract gelanceerd. Die tool maakt gebruik van de nieuwste AI-modellen om ongestructureerde documenten en andere bestanden om te zetten in gestructureerde data.
De hoeveelheid data binnen organisaties groeit en groeit, maar het merendeel daarvan zit ‘vast’ in ongestructureerde formaten zoals scans, polissen en rapporten. Box tackelt dat probleem met Box Extract, wat al in september werd gepresenteerd. De tool fungeert als een intelligent laagje bovenop de opgeslagen content, die automatisch relevante informatie herkent en opslaat als metadata.
Multi-model aanpak met slimme agents
Wat Box Extract onderscheidt van eerdere OCR-oplossingen (Optical Character Recognition), is het gebruik van agentic AI. In plaats van alleen tekst te herkennen begrijpt de software de context. Box geeft gebruikers de keuze uit verschillende bekende modellen van dit moment, waaronder Google Gemini 3, Anthropic Claude Opus 4.5 en OpenAI GPT 5.2.
Gebruikers kunnen ook specifieke ‘Extract Agents’ trainen en die inzetten voor specifieke taken. Het bedrijf geeft voorbeelden van een juridische afdeling die bijvoorbeeld een agent kan aanmaken die specifiek zoekt naar vervaldatums en contractpartijen, terwijl een verzekeraar een agent instelt op het extraheren van schadebedragen uit politierapporten.
Naast teksten kan Box Extract ook overweg met PDF’s, spreadsheets, handgeschreven aantekeningen en afbeeldingen. Door semantische relaties tussen velden te herkennen, extraheert het systeem ook complexe, onderling verbonden datapunten. Ingebouwde validatiechecks zorgen ervoor dat de uitvoer direct te gebruiken is in workflows van een bedrijf of organisatie.
Integratie in het ecosysteem
De kracht van de nieuwe functie zit hem volgens het bedrijf voornamelijk in de vervolgstappen. De onttrokken data blijft namelijk niet alleen in Box staan. Via Box Relay kunnen acties worden getriggerd zodra bepaalde data is gevonden, bijvoorbeeld een automatische goedkeuring bij een factuur onder de 500 euro.
Daarnaast is er data warehouse-koppeling aanwezig, waarbij gestructureerde gegevens direct gesynchroniseerd kunnen worden met platforms zoals Databricks en Snowflake voor verdere analyse. Tot slot kunnen er ook dashboards worden ingericht, waardoor gebruikers direct een visueel overzicht kunnen inzien op basis van de metadata.
Box heeft nog meer praktijkvoorbeelden gedeeld. Zo gebruikt de Texas Department of Motor Vehicles de tool om de enorme stroom aan papieren formulieren te digitaliseren. Dat zorgt ervoor dat ambtenaren minder tijd kwijt zijn aan papierwerk. In de financiële sector kan Box Extract gebruikt worden om complexe verzekeringsillustraties en commissieoverzichten te verwerken, waarbij de nauwkeurigheid een stuk hoger is dan wanneer dat met de hand moet worden gedaan.
Box Extract is per direct beschikbaar voor klanten met een Enterprise Advanced-licentie. Er wordt onderscheid gemaakt tussen een standaardvariant voor simpele documenten en een Enhanced versie die overweg kan met grote, variabele of visueel complexe bestanden zoals bouwtekeningen of tabellen.