OpenAI beschikt al ongeveer een jaar over een systeem dat een watermerk toevoegt aan teksten die ChatGPT genereert. Ook een tool om een watermerk te detecteren is gereed. Dat meldt The Wall Street Journal.
Binnen OpenAI bestaat echter verdeeldheid over de vraag of men dit watermerk moet invoeren. Enerzijds lijkt het een verantwoorde stap. Anderzijds zou het de winst van de onderneming kunnen schaden. Men omschrijft het watermerk van OpenAI als een aanpassing van de voorspelling welke woorden op eerdere woorden in een zin moeten volgen. Hierdoor ontstaat een detecteerbaar patroon. Hoe dit kan werken wordt hier uitgelegd.
Gunstig voor docenten
Het aanbieden van een manier om AI-geschreven materiaal te detecteren kan een uitkomst zijn voor docenten die willen voorkomen dat studenten hun schrijfopdrachten door AI laten maken. The Wall Street Journal (WSJ) meldt dat OpenAI inmiddels ontdekte dat het watermerk de kwaliteit van de tekstuitvoer van de chatbot niet beïnvloedt. In een enquête die het bedrijf liet uitvoeren, “ondersteunde de wereldwijde bevolking het idee van een AI-detectietool met een verhouding van vier tegen één,” schrijft de krant.
Nauwkeurige methode
Na de publicatie van het artikel bevestigt OpenAI in een blogpost-update, dat het aan het watermerken van tekst heeft gewerkt. In de update zegt het bedrijf dat de methode zeer nauwkeurig is. Het zou voor 99,9% effectief zijn, volgens documenten die de WSJ heeft ingezien. En is bestand tegen “manipulaties, zoals parafraseren.”
Het bedrijf maakt zich echter zorgen over de stigmatisering van de bruikbaarheid van AI-tools voor niet-moedertaalsprekers.
Drempel bij gebruikers
Het lijkt er echter op dat OpenAI zich ook zorgen maakt dat het gebruik van watermerken gebruikers zou kunnen afschrikken. 30 procent van de gebruikers meldde blijkbaar dat ze de software minder zouden gebruiken als het over een watermerk beschikt.
Desondanks zijn er naar verluidt nog steeds enkele medewerkers binnen OpenAI die vinden dat watermerken effectief zijn. In het licht van de aanhoudende gevoelens van gebruikers, zegt WSJ dat sommigen hebben voorgesteld methoden te proberen die “mogelijk minder controversieel zijn onder gebruikers maar nog onbewezen.”
“Eerste verkenning”
In een blogpost-update zegt OpenAI dat het “in de beginfase” is van het verkennen van het embedden van metadata. Het zegt dat het nog “te vroeg” is om te weten hoe goed dit zal werken, maar dat er geen vals-positieven zouden zijn omdat het cryptografisch is ondertekend.