Google test een nieuwe API die gebruik maakt van machine learning-modellen om real-time vertalingen van ingevoerde tekst aan te bieden. En om het gemakkelijker te maken webpagina’s te vertalen.
Volgens een voorstel dat Bleeping Computer signaleert, ontwikkelt het AI-team van Chrome deze functie. Het moet de ingebouwde vertaalfunctionaliteit van de webbrowser en de mogelijkheid om extra taalmodellen te downloaden om tekst te vertalen toegankelijker maken.
Interactieve website soms hindernis
Chrome en Edge hebben al ingebouwde vertaalfuncties. Toch hebben ze soms problemen met het vertalen van webpagina’s met een dynamische of complexe inhoud. Zo vertaalt Chrome bijvoorbeeld niet altijd alle onderdelen van een interactieve website correct.
In zulke gevallen hebben websites hun eigen vertaaltool. Die gebruiken echter veel capaciteit. En ze zijn vaak trager in vergelijking met de ingebouwde functie van de browser. Google is van plan ontwikkelaars toegang te geven tot de aankomende AI-gebaseerde vertaalfunctie van Chrome via een eenvoudige JavaScript API.
“Om in dergelijke gevallen vertalingen uit te voeren, moeten websites momenteel ofwel cloud-API’s aanroepen, of hun eigen vertaalmodellen gebruiken. En die dan draaien met technologieën zoals WebAssembly en WebGPU,” legt Google uit.
Nieuwe JavaScript API
“Dit voorstel introduceert een nieuwe JavaScript API om de bestaande vertaalmogelijkheden van de browser beschikbaar te stellen aan webpagina’s, zodat die kunnen dienen als een eenvoudigere en minder resources-intensieve oplossing,” aldus Google.
De nieuwe AI/API-functie zou dit proces vereenvoudigen door gebruik te maken van de ingebouwde vertaalmachine van Chrome voor bestaande inhoud of voor ingevoerde tekst, zoals in een forum of een real-time chatdienst.
De functie zal een machine learning-model downloaden om de tekst correct te vertalen als het vereiste vertaalmodel niet in de browser is ingebouwd.
Zorgen om privacy
Het voorstel brengt echter enkele privacy-kwesties met zich mee, omdat het mogelijk zou kunnen maken dat een website een gebruiker identificeert op basis van de ondersteunde talen van de browser en de beschikbaarheidsstatus ervan.
“De meest voor de hand liggende identificator in het huidige API-ontwerp is de lijst met ondersteunde talen, en vooral hun beschikbaarheidsstatus (‘nee’, ‘beschikbaar’, of ‘na-download’),” waarschuwt Google.
“Bijvoorbeeld, op het moment van schrijven ondersteunt Firefox 9 talen, die elk afzonderlijk kunnen worden gedownload. Bij een naïeve implementatie geeft dit 9 bits aan identificerende informatie, die verschillende websites allemaal kunnen correleren.”
De ontwikkelaars zetten al mogelijke oplossingen uiteen, zoals het groeperen van taalpakketten om het aantal bits te verminderen. Of alleen een vaste set talen bloot te stellen op basis van de locatie van de gebruiker.
Het voorstel vermeldt ook de mogelijkheid voor ontwikkelaars om te bepalen of de vertaling via cloud-diensten gebeurt, of dat het lokaal op het apparaat wordt uitgevoerd. In dat geval kan men ervoor zorgen dat geen gevoelige tekst naar een externe dienst wordt verzonden, wat datalekken voorkomt.
Het is onduidelijk wanneer Google de functie aan Chrome toevoegt. Het bedrijf onderzoekt en bespreekt het idee actief met de open-sourcegemeenschap.