3min Gadgets

Google’s Gemini 2.5 leert surfen als een mens en voert taken zelfstandig uit

Google’s Gemini 2.5 leert surfen als een mens en voert taken zelfstandig uit

Google introduceert vandaag een nieuwe stap voorwaarts in AI-agentenland: het model Gemini 2.5 Computer Use kan een webbrowser besturen zoals een mens, en daarmee zelfstandig complexe webtaken uitvoeren — zonder dat er voortdurend menselijke tussenkomst nodig is.

Als een mens

Wanneer je een verzoek indient, bijvoorbeeld “zoek dit product, vul het formulier in en bevestig de aankoop”, start er een interactieve loop: je stuurt een prompt (eventueel met screenshot en actielog), waarna Gemini 2.5 Computer Use bepaalt welke UI-acties (klikken, typen, scrollen, dropdowns bedienen) nodig zijn om het doel te bereiken. De cliënt voert die acties uit, stuurt een nieuwe screenshot terug, en de cyclus herhaalt zich tot de taak voltooid is of een fout optreedt.

Google benadrukt dat dit model uitsluitend opereert binnen webbrowsers — niet op systeemniveau van het besturingssysteem — en momenteel zo’n dertien vooraf gedefinieerde acties ondersteunt.

Praktijkvoorbeelden

In demonstraties voert Gemini 2.5 Computer Use geavanceerde taken uit, zoals het registreren van een huisdier in een spa-CRM-systeem, of het organiseren van notities in een online bord. In de eerste demo moet het systeem de gegevens van een huisdier uit Californië ophalen van een formulier, toevoegen aan de CRM van een spa, en meteen een vervolgafspraak plannen met een specialist. In de tweede demo plaatst het model sticky notes in de juiste secties op een online whiteboard en wordt er gesleept om orde te brengen.

Vergelijking met concurrenten

Hoewel Google later is dan sommige concurrenten — OpenAI en Anthropic hebben al vergelijkbare functionaliteiten in hun agenttools geïntegreerd — trekt Google de focus bewust smal: alleen browserinteractie. In tegenstelling tot sommige concurrenten kan Gemini 2.5 Computer Use niet ingrijpen op het hele besturingssysteem.

Toch claimt Google dat Gemini 2.5 Computer Use uitblinkt op verschillende benchmarks voor web- en mobiele controle — met name op Browserbase / Online-Mind2Web en AndroidWorld.

Volgens onderzoekers behaalt het model superieure prestaties, ook met lage latentie (snelle reactietijd) binnen de browseromgeving.

Toegang en kosten

Ontwikkelaars kunnen toegang verkrijgen tot Gemini 2.5 Computer Use via Google AI Studio en Vertex AI, via de Gemini API. ([Google AI for Developers][3]) Qua prijsstructuur volgt het model grotendeels dezelfde tokengebaseerde tarieven als Gemini 2.5 Pro. Een belangrijk verschil is dat Gemini 2.5 Computer Use geen gratis tier biedt — gebruikers moeten vanaf het begin betalen.

Google waarschuwt dat, in zijn huidige ‘preview’-fase, dit model fouten kan maken. Voor belangrijke taken of gevoelige gegevens wordt aangeraden om toezicht te houden.