GANs: tooling van morgen

Slechts een van deze mensen bestaat echt. De rest is gemaakt door een GAN van Nvidia. Is de persoon van vlees en bloed te herkennen?

Het portret van een vaag geschilderde man hing al een paar dagen bij Christie’s in New York. Op het eerste gezicht leek het weinig voor te stellen. Toch had het kunstwerk één unieke eigenschap. De maker was geen mens maar een slim algoritme. De opbrengst overtrof alle voorspellingen. Het portret van de fictieve Edmond de Bellamy werd uiteindelijk voor maar liefst $432,500 verkocht.

Een schilderij dat gemaakt is met de volledige inzet van Kunstmatige Intelligentie (KI) is uiteraard voer voor discussie in de kunstwereld. Dat geldt ook voor de impact op ICT. Het portret is tot stand gekomen met de inzet van een revolutionair zogeheten Generative Adversarial Network (GAN). Het produceren van content in allerlei datavormen kan hiermee vele malen sneller en makkelijker gaan. En het resultaat lijkt bovendien ook beter en creatiever. Zo zijn geavanceerde visualisaties bijvoorbeeld nauwelijks meer van echte fotografie te onderscheiden. Yann LeCunn, de KI-directeur van Facebook, noemt GANs de meest ‘coole’ deep learning technologie van de afgelopen twintig jaar. En de Chinees-Engelse computerwetenschapper Andrew Ng, bekend van Baidu en Google Brain, spreekt over een fundamentele vooruitgang dankzij GANs. Deze technologie gaat waarschijnlijk het leven van vele ict-professionals veranderen.

 

Zo echt mogelijk

KI-autoriteit Ian ‘TheGANfather’ Goodfellow introduceerde deze slimme technologie in 2014. Het zijn twee neurale netwerken die hoor-wederhoor toepassen. Het ene netwerk is een ‘generator’ die zo echt mogelijke output genereert. Het andere netwerk is de ‘discriminator’ dat beoordeelt of de aangeboden data echt of namaak is. De een probeert de ander voor de gek te houden. En de ander wil daar juist niet intrappen. Op die manier geven ze elkaar voortdurend feedback en vormen zo een succesvolle variant van unsupervised learning. GANs zijn uitermate geschikt voor het maken van plaatjes. Met de CycleGan worden schilderstijlen van grootmeesters als Monet en Van Gogh eenvoudig overgedragen op normale foto’s. En met de GauGAN van Nvidia is heel snel en eenvoudig een fotorealistisch landschap te tekenen in een vergelijkbaar programma als Microsoft Paint. Het lijkt allemaal heel simpel te worden. Een kwestie van data en foto’s invoeren, wat training en daarna ontstaat de meest geavanceerde digitale content waar softwareontwikkelaars vandaag de dag nog weken, zo niet maanden aan werken.

 

Een revolutie in creativiteit

Zo stelt Andrew Price, goeroe op het gebied van 3D, dat een gemiddelde ontwerper zo’n 44 tot 66 uur bezig is met het ontwerp van een virtueel gebouw. Met een gemiddeld uurtarief kost een kant-en-klaar virtueel huisontwerp zo’n $3.900. Het bedrag voor een compleet ingerichte straat in een game loopt dan al snel op naar $200.000. Met behulp van GANs geeft de ontwerper gewenste parameters zoals bouwhoogte en het aantal ramen op, waarna de software zelf verschillende opties genereert. Dankzij de automatisch gegenereerde varianten hoeft de ontwerper niet langer eindeloos te experimenteren. Of het nu een huis of het ontwerp van een auto, app, interface of willekeurige website is, met GANs wordt de ontwikkeling van het digitale product een stuk makkelijker.

En GANs gaan nog verder. Zo hebben onderzoekers van de Michigan Universiteit een GAN gecreëerd die tekst omzet naar realistische foto’s. De zin: ’vogel met gele buik, zwarte rug, bruine keel en zwarte kop’ wordt omgezet naar een zo realistisch mogelijke foto van een vogel. Wie weet ontwikkelen GANs zich zodanig dat de app of het presentatiebeeld straks met een paar woorden gemaakt is.

 

Synthetische data

Wat voor beeld geldt, is ook van toepassing op tekst of andere typen data. Zo kunnen privacygevoelige gegevens als input dienen van een GAN waarmee synthetische data aangemaakt wordt. Een synthetische dataset heeft twee goede eigenschappen: het is absoluut representatief voor de originele gegevens en privacybescherming is gewaarborgd. Op die manier kan synthetische data het antwoord zijn voor issues rondom eigenaarschap van data en het bieden van betere en/of gratis dienstverlening in ruil voor persoonlijke gegevens. Bijvoorbeeld voor medisch onderzoek kan dan straks door GANs gegenereerde data ingezet worden. Bedrijven kunnen ook geld verdienen met synthetische data waar voorspellingen mee gedaan kunnen worden.

 

De tooling van morgen?

Kortom, de GAN-beloftes zijn groot. Niet alleen op het vlak van snelheid, creativiteit en gebruikersgemak. De inzet van GANs heeft ook invloed op onze omgang met privacybescherming en het geven van toestemming voor het delen van data. Het grote nadeel is natuurlijk dat genereerde content straks niet of nauwelijks meer van echt te onderscheiden is. Een kat-en-muis-spel van foppen en herkennen dat voorlopig niet zal stoppen.

Veel onderzoekers op het vlak van Kunstmatige Intelligentie zijn ervan overtuigd dat GAN-technologie de komende jaren steeds beter wordt. De grote vraag is uiteraard hoeveel impact deze ontwikkelingen hebben op onze ict-huishouding en de verhouding tussen mens en machine in het ontwikkelproces. De kracht van GANs zijn echter ook hun zwakte. Ze maken nieuwe creaties die in lijn liggen met de input. Een GAN die getraind is in het maken van hondenfoto’s, komt niet in één keer met een hond op een fiets.

‘Zo dom als een GANs’ zal straks uit het woordenboek verdwijnen, maar voorlopig blijft de mens nodig om buiten de lijntjes te kleuren en buiten het spreekwoordelijke hokje te denken.

Thijs Pepping is trendanalist bij het Verkenningsinstituut Nieuwe Technologie van ICT-dienstverlener Sogeti

 

 

Gerelateerde berichten...

X