OpenAI Group PBC heeft GPT Image 1.5 gelanceerd, een nieuw kunstmatig intelligentiemodel dat is geoptimaliseerd voor het genereren en bewerken van beelden. Met deze introductie zet het bedrijf een volgende stap in de snelle ontwikkeling van generatieve AI, enkele weken nadat Google zijn eigen nieuwe beeldgenerator presenteerde. Net als Googles Nano Banana Pro richt GPT Image 1.5 zich nadrukkelijk op betere instructieopvolging en nauwkeurigere tekstweergave, maar OpenAI benadrukt dat het model op meerdere punten verder is verbeterd.
Beeldgeneratiefunctie
Ontwikkelaars krijgen toegang tot GPT Image 1.5 via een application programming interface. Opvallend is dat de prijsstelling van deze API ongeveer twintig procent lager ligt dan die van het vorige beeldmodel van OpenAI. Daarmee wil het bedrijf de drempel voor commerciële toepassingen verlagen. Niet technische gebruikers kunnen het model gebruiken via de beeldgeneratiefunctie binnen ChatGPT, die automatisch is overgeschakeld op het nieuwe systeem.
Volgens OpenAI levert de overstap directe prestatievoordelen op. ChatGPT kan met GPT Image 1.5 beelden tot vier keer sneller genereren dan voorheen. Dat wijst op een hogere hardware efficiëntie, waardoor het model minder rekenkracht en energie nodig heeft. Snellere verwerking betekent niet alleen een soepelere gebruikerservaring, maar ook lagere operationele kosten en een kleinere ecologische voetafdruk.
Beeldbewerking
Een belangrijk verbeterpunt is de manier waarop het model omgaat met beeldbewerking. Bij eerdere AI systemen kwam het geregeld voor dat ongewenste details werden aangepast, zelfs als de gebruiker daar niet om had gevraagd. Voor creatieve hobby toepassingen is dat vaak geen groot probleem, maar in commerciële contexten kan het riskant zijn. Een merk dat een productafbeelding wil aanpassen, wil bijvoorbeeld niet dat een logo verdwijnt. OpenAI stelt dat GPT Image 1.5 beter in staat is om cruciale beeldelementen te behouden terwijl gewenste wijzigingen worden doorgevoerd.
Daarnaast is het model beter in complexe, meerstapsbewerkingen. Gebruikers kunnen bijvoorbeeld objecten uit meerdere tekeningen laten samenvoegen in één beeld en vervolgens de illustratiestijl aanpassen. Ook tekstweergave kreeg extra aandacht tijdens de training. GPT Image 1.5 kan kleine en dichte tekst nauwkeuriger renderen, wat het model geschikter maakt voor toepassingen zoals infographics.
Tekenstijlen
OpenAI erkent dat het model nog beperkingen heeft. Sommige tekenstijlen worden slechts beperkt ondersteund en bij beelden waarvoor specifieke wetenschappelijke kennis nodig is, kunnen fouten optreden. Wel presteert GPT Image 1.5 op dit vlak beter dan zijn voorganger.
Het model is beschikbaar via een nieuwe sectie in ChatGPT, met vooraf ingestelde filters en promptsuggesties die regelmatig worden vernieuwd. De lancering volgt kort op de introductie van GPT 5.2, het nieuwste basismodel van OpenAI, dat volgens interne tests uitblinkt in wetenschappelijke taken. Tegelijk presenteerde het bedrijf FrontierScience, een nieuwe benchmark met meer dan zevenhonderd vragen uit natuurkunde, scheikunde en biologie, bedoeld om de wetenschappelijke capaciteiten van AI modellen te meten.