Microsoft heeft drie nieuwe eigen AI-modellen aangekondigd Het gaat om MAI-Transcribe-1 voor spraaktranscriptie, MAI-Voice-1 voor spraakgeneratie en MAI-Image-2 voor het creëren van afbeeldingen. De modellen zijn beschikbaar via Microsoft Foundry. Microsoft positioneert ze als sneller, nauwkeuriger en voordeliger dan vergelijkbare alternatieven van andere grote cloudproviders.
De modellen zijn per direct te gebruiken door ontwikkelaars en bedrijven. Eerder introduceerde Microsoft al Fara-7B, een agentisch taalmodel dat lokaal op een pc draait. De nieuwe MAI-modellen richten zich op drie andere domeinen: spraakherkenning, spraakgeneratie en beeldcreatie.
Via de MAI Playground zijn de modellen ook uit te proberen, al geldt dat vooralsnog alleen voor gebruikers in de Verenigde Staten. Ontwikkelaars zonder toegang tot Foundry kunnen zich aanmelden via een formulier op de website van Microsoft.
MAI-Transcribe-1: snelle transcriptie in 25 talen
MAI-Transcribe-1 biedt speech-to-text transcriptie in de 25 meest gebruikte talen. De batchtranscriptiesnelheid ligt 2,5 keer hoger dan de bestaande Azure Fast-service. Microsoft claimt de beste prijs-prestatieverhouding van alle grote cloudproviders. De prijs start bij 36 dollarcent per uur.
MAI-Voice-1 is het vlaggenschip op het gebied van spraakgeneratie. Het model genereert 60 seconden audio in een seconde en behoudt daarbij de sprekeridentiteit, ook in langere content. Ontwikkelaars kunnen via Foundry een eigen stemmodel aanmaken op basis van enkele seconden audio. MAI-Voice-1 is beschikbaar vanaf 22 dollar per miljoen tekens.
MAI-Image-2: beeldgeneratie voor creatieve professionals
MAI-Image-2 richt zich op fotografen, ontwerpers en andere visuele professionals. Het model levert minimaal twee keer snellere generatietijden op Foundry en Copilot ten opzichte van de vorige generatie, gebaseerd op productiedata. Microsoft is al gestart met de gefaseerde uitrol in Bing en PowerPoint. De prijs bedraagt 5 dollar per miljoen tokens voor tekstinvoer en 33 dollar per miljoen tokens als je afbeeldingen wilt laten maken.
Microsoft laat weten de modellen ook in eigen producten en diensten te integreren. Via Microsoft AI worden de MAI-modellen verder uitgerold in Copilot en andere Microsoft-toepassingen. De modellen zijn ontwikkeld, getest en uitvoerig getest op veiligheid via red-teaming. Foundry biedt daarnaast ingebouwde beheermechanismen en enterprise-grade beveiligingscontroles.