Anthropic heeft zijn chatbottoepassingen, aangedreven door de Claude-technologie, een nieuwe upgrade gegeven door de lancering van een ‘spraakmodus’ die de interactie met gebruikers aanzienlijk verbetert. Deze spraakmodus bevindt zich momenteel in een bètafase, maar wordt binnenkort algemeen beschikbaar gesteld.
Spraak
De nieuwe spraakmodus maakt het mogelijk om ‘volledige gesproken gesprekken’ te voeren met de generatieve kunstmatige intelligentie-assistent. Dit is een belangrijke stap voor Anthropic, aangezien het nu gelijke tred houdt met concurrenten zoals OpenAI, Google LLC en andere bedrijven die vergelijkbare functionaliteiten aanbieden.
De lancering van de spraakmodus is een direct antwoord op innovaties van rivalen. Zo biedt Google de ‘Gemini Live’ ervaring, waarmee gebruikers kunnen praten met de chatbot binnen de Gemini-app en zelfs hun scherm kunnen delen om vragen te stellen over wat ze zien. Ook xAI Corp. van Elon Musk heeft een soortgelijke functie, genaamd ‘Voice Mode for Grok’, en OpenAI ondersteunt ook gesprekken via stem in zijn ChatGPT.
Spraakmodus
De spraakmodus is in wezen gelijk aan de versies van concurrenten, waardoor gebruikers direct tegen de chatbot kunnen spreken in plaats van tekst in te voeren. Dit is ontworpen om de interacties door middel van spraak natuurlijker en intuïtiever te maken.
Anthropic heeft aangekondigd dat gebruikers in staat zullen zijn om met Claude te praten over afbeeldingen en documenten. Bovendien kunnen ze kiezen uit vijf verschillende stemmen. Er is een eenvoudige knop om te schakelen tussen tekst en spraak, en elke interactie genereert een transcript en een samenvatting van het gesprek.
Claude
Volgens een ondersteuningspagina zal de spraakmodus het gemakkelijker maken voor gebruikers om met Claude te communiceren wanneer hun handen bezig zijn, maar hun geest niet. De modus is standaard aangedreven door het Claude Sonnet 4-model, maar gebruikers kunnen ook kiezen voor andere modellen.
Er zijn echter beperkingen, vooral voor gratis gebruikers van de app. Gratis gebruikers kunnen verwachten ongeveer 20 tot 30 gesprekken per dag te hebben voordat ze hun limieten bereiken. Daarnaast zijn functies zoals de Google Workspace-connector, die Claude toegang geeft tot Gmail en Google Calendar-informatie, alleen beschikbaar voor Claude Enterprise-abonnees.
Spraakfunctionaliteiten
Hoewel Anthropic weinig heeft gezegd over de partners waarmee het werkt om de spraakmodus mogelijk te maken, onthulde Chief Product Officer Mike Krieger in maart dat het gesprekken had met Amazon Web Services Inc. en de startup ElevenLabs Inc. over de toevoeging van spraakfunctionaliteiten aan Claude.