Sinds mensenheugenis is het samenspel tussen business en IT een uitdaging. Dat komt omdat de traditionele IT-professional nu eenmaal een andere taal spreekt dan de marketeer die een nieuw verdienmodel wil lanceren.
De één weet niet wat de ander bedoelt bij de ontwikkeling van nieuwe applicaties bijvoorbeeld. De softwareontwikkelaar heeft weinig tot geen oog voor gebruikersvriendelijkheid. Diens focus tijdens het bouwen is de technische functionaliteit en niet het gedrag van de consument. Nu technologie steeds toegankelijker wordt gaat dat beter. Maar het wordt pas echt anders met de komst van de tekst-naar-alles ontwikkeling. Hierbij wordt op basis van tekst een directe vertaling gemaakt naar een plaatje, code, video of zelfs een complete 3D-omgeving.
Bepaalde woorden
Dit najaar was de kunstwereld in rep en roer toen ene Jason Allen een kunstwedstrijd won met een door AI gemaakt kunstwerk. Dat kunstmatige intelligentie kan winnen van kunst afkomstig van mensen van vlees en bloed, was al langer bekend.
Het zat in dit geval vooral in de uitleg van deze synthetische kunstenaar over het maakproces. Allen legde uit dat hij het werk had geproduceerd met de AI kunsttool ‘Midjourney’. Deze kunstmatige intelligentie maakt hyperrealistische afbeeldingen op basis van ingevoerde tekst. Allen voerde alleen bepaalde woorden in waarna de kunstmatige intelligentie de rest deed. De jury was geraakt door de specifieke bewoording die Allen had gevonden. Daarmee kon de slimme technologie haar werk doen. Of anders gezegd, de kunstenaar had een taal ontdekt die hem de eerste prijs opleverde.
Tekst-naar-alles
Midjourney is niet de enige tool die taal omzet naar hyperrealistische beelden. In rap tempo volgen lanceringen van de meest geavanceerde synthetische media tools elkaar op. Dankzij de opkomst van No-Code en creatieve AI, waarin zogeheten ‘tekst-naar-alles’-mogelijkheden oneindig lijken, wordt de kracht van taal enorm belangrijk.
Ook met ‘Dall-E2’ en ‘Stable diffusion’ tooling is het relatief eenvoudig een gedachte te omschrijven waarna de kunstmatige intelligentie dat visualiseert. ‘Meta’s Builderbot’ belooft zelfs dat droomwerelden worden nagebouwd in een volledige 3D-omgeving. Ontwikkelaars die toch met code willen werken, kunnen ook een beroep doen op tekst-to-code oplossingen. Denk daarbij aan het GPT-3-gebruik door Microsoft.
Van prompts naar beeld
Deze ontwikkeling waarin we ogenschijnlijk eenvoudig tekst naar (3D)-beeld kunnen laten transformeren, zorgt voor een flinke verschuiving naar rijkere, complexe ofwel ‘dikkere’ data. Nog niet zo lang geleden publiceerde Google Imagine Video, vergelijkbaar met Make-a-video van Meta. Beide zijn tooling waarmee opgegeven tekst omgezet wordt naar video.
Met ‘runwayml’ worden video’s vervolgens weer bewerkt. In een kersverse demo is te zien hoe het commando ‘import city street’ een video creëert van een straat met verkeer in een grote stad. De zogeheten prompt ‘make it more cinematic’ zorgt vervolgens voor een blauw, filmachtig filter. Ook het verwijderen van een lantaarnpaal is een koud kunstje. Een kwestie van intikken dat het object weggehaald mag worden.
De kracht van taal
Door deze trend van tekst-naar-alles wordt taal belangrijker dan ooit. Hoe bizar kan het zijn dat IT-professionals – van origine veelal beta-types– nu het verschil gaan maken met wat tot voor kort tot het domein van alpha-types behoorde: de kracht van taal. Taalgevoeligheid wordt meer dan ooit een onderscheidende vaardigheid. Nu al ontstaat een hele bedrijfstak rondom deze nieuwe vaardigheden.
Zo noemt startup Promptbase.com zichzelf ‘een marktplaats voor het kopen en verkopen van kwaliteitsprompts die de beste resultaten opleveren’. Gebruikers kunnen een beroep doen op tekstprompts gerelateerd aan avatars, logo’s en foto’s. Dit platform verkoopt afbeeldingsprompts voor eerder genoemde AI-modellen. Daarmee wordt geld bespaard op API-kosten, is de belofte.
Geen jargon meer
Een ander gevolg van deze tekst-naar-alles noviteit is dat de kloof tussen idee en uitvoering een stuk kleiner wordt. De kwaliteit van het idee wordt des te belangrijker. Hoe iemand komt tot een creatief product of hoe goed de oplossing is voor het probleem; het wordt allemaal nog uitdagender.
En nog een bijzondere bijvangst van dit alles is dat het de tweespalt of taalbarrière tussen business en IT definitief beslecht. Jargon zit niet langer in de weg, want ingewikkelde terminologie voor ingewijden doet het immers niet zo goed in al die opkomende kunstmatige intelligentie. Wat wel duidelijk wordt, is dat de woordkunstenaars onder IT-professionals het komende decennium flink zullen floreren.
Thijs Pepping is trendanalist van Verkenningsinstituut Nieuwe Technologie (VINT) van Sogeti.
Lees ook:
- Joris, de realiteitsbouwer
- De lange neus van de metaverse