Lapsen piirustuksesta valokuvamaisemaksi

Nykymaailman tietotekniikkaelämään kuuluu paljon kuva- ja videomateriaalin kanssa työskentelyä. Tämä on ollut ihan odotettavissa ja ennustettavissa oleva ilmiö: ihminen vastaanottaa tietoa helpommin kuvien kautta, ja yhä useampi bloggaaja on siirtynyt näyttämään asioita eikä kirjoittamaan niistä. Välillä asioiden näyttäminen voi olla kuitenkin työlästä, ja siihen ollaan koko ajan kehittämässä uusia ratkaisuja. Näytönohjaimien huippuvalmistaja NVIDIA on myös tehnyt töitä graafisen työn helpottamisen eteen, ja esitti GTC 2019 -konferenssilla demoversion kehittämästään GauGAN-nimisestä neuroverkosta.

Taiteilijan Kunniaksi

Neuroverkko nimettiin kuvataiteilija Paul Gauguinin kunniaksi, sillä GauGANilla on paljon tekemistä kuvataiteen kanssa. GauGAN perustuu tekoälyn oppimiin funktioihin ja käyttää työssään GANia. GAN on generative adversarial network, joka pitää sisällään kaksi erillistä verkkoa. Toinen verkoista luo kuvia sen perusteella, mitä tietoja se on saanut, ja toinen verkko tarkistaa kuvien aitouden. Pähkinän kuoressa järjestys on siis seuraava: ensin generaattori luo kuvan ja näyttää sen toiselle verkolle, joka on oppinut useita todellisia kuvia ja ymmärtää jotain valokuvauksesta ja taiteesta. Tämä toinen verkko, jota sanotaan myös diskriminaattoriksi, palauttaa generaattorille tiedon, josta generaattori lukee ehdotettuja korjauksia jokaista pikseliä myöten ja korjausten jälkeen toimittaa saadun kuvan taas tarkistettavaksi. Näin jatkuu siihen saakka, kunnes diskriminaattori on hyväksynyt kuvan aidoksi. Vielä yksinkertaisemmin sanottuna, tämä on ikään kuin värityskuvien värittämistä, mutta lopputuloksena ei saada lasten piirustuksia vaan oikeita ja aidoilta näyttäviä maisemia. NVIDIAn GauGANin parissa työskentelevä tiimi korostaa, että heidän kehittämä neuroverkko ei siis vain liimaa kuvia yhteen vaan luo ainutlaatuisia opuksia kuin oikea taiteilija.

Mitä Muuta Se Osaa?

Tämä NVIDIAn luoma neuroverkko ei ole luotu ainoastaan kuvien tekemiseen. Se osaa imitoida erilaisten taiteilijoiden tyyliä ja jopa vaihtaa vuorokauden aikaa ja vuodenaikaa olemassa oleviin valokuviin. Lisäksi se generoi hyvin realistisia heijastuksia veden pinnalla, kun on selvää, että nyt metsän pitäisi heijastua järven vesipinnan peilistä. Tällä hetkellä GauGAN on räätälöity nimenomaan maisemien kanssa työskentelylle, mutta tämän neuroverkon arkkitehtuuri sallii sen opettamista ja järjestelmän jatkuvaa oppimista. Sen jälkeen työkalu pystyy luomaan myös urbaanisia kuvia eli kaupunkimaisemia ja todennäköisesti myös sisustuksia. Sisustuksesta puheen ollen, jostain syystä GauGAN tykkää eniten sohvista ja ne onnistuvat siltä aina täydellisinä.

Käytön Näkymiä Ja Tulevaisuutta

Kenelle siis tällainen innovaatio olisi tarpeen? Ihan looginen kysymys, sillä harvemmin lähdemme skannaamaan lastemme piirtämiä piirustuksia saadaksemme niistä kunnon maisemia. Siihen GauGAN ei ole luotukaan. Sen kehittymisen myötä GauGAN tulee mitä todennäköisimmin arkkitehtien ja kaupunkisuunnittelijoiden työkaluksi, ja tällaisen työkalun kanssa työskentely tulee varmasti helpommaksi kuin 3D-mallinnus. 3D-mallinnus on siinä mielessä hyvä, että siitä saadaan kuvia joka suuntaan ja sen perustana olevien piirustusten pohjalta luodaan jatkossa rakennekuvatkin, mutta luonnosvaiheessa kolmiulotteinen mallintaminen on melko työlästä ja usein valitettavan turhaa. Maisema-arkkitehdeille GauGAN on jo nykyisessä muodossaan oikea löytö, ja sama koskee myös peliohjelmoijia: tekoäly, joka oppii ja tietää, miltä todellinen maailma näyttää, on oiva helpotus pelisuunnittelussa. Sen avulla onnistuvat rohkeimmatkin ideat, joiden toteutus olisi aikaisemmin vaatinut useita kertoja enemmän aikaa, piirtämistä ja mallintamista. Muutokset onnistuvat myös helposti, ja loppujen lopuksi työkalun tekoäly voi oppia jopa tietyn arkkitehdin tai pelisuunnittelijan tyylin tutuksi, minkä jälkeen elävän ammattilaisen ja tekoälyn työpari on aivan lyömätön yhdistelmä uuden maailman luomiseen.