Tekoälypohjaiset grafiikkageneraattorit ovat ottaneet ison harppauksen eteenpäin vuoden 2022 aikana. Tekoälyn tekemät kuvat ovat olleet aiemmin kuriositeetti, joilla on esitelty tekoälyalgoritmien mahdollisuuksia, mutta nyt generaattorit alkavat jo lähestyä tasoa, jossa niistä tulee matalan kynnyksen arkipäiväisiä työkaluja grafiikan luomiseen. Tekoälyllä voidaan jo nyt tuottaa grafiikkaa myös verkkosivujen kuvittamiseen.
North Patrol on suunnitteluun erikoistunut konsulttitoimisto. Suunnittelemme, autamme teknologiavalinnoissa, kilpailutamme. Emme myy toteutusprojekteja, emmekä lisenssejä, olemme aidosti asiakkaan puolella.
Grafiikkaa luovat tekoälyohjelmistot
Grafiikkaa tuottavat tekoälyohjelmat perustuvat koneoppiviin algoritmeihin, joille syötetään valtava määrä kuvia ja niitä kuvaavaa tietoa. Opetusaineiston perusteella algoritmi oppii, mitä kuvat esittävät ja mitä lainalaisuuksia niiden sisältöön liittyy. Kun algoritmille opetetaan riittävä määrä aineistoa, sitä voidaan hyödyntää uuden grafiikan luomisessa avainsanojen perusteella.
Tänä vuonna markkinoille on tullut useita käyttökelpoisia sovelluksia, joilla kuka tahansa voi aloittaa tekoälyn käytön grafiikan luomiseen.
Nykyisten tekoälygrafiikkaohjelmistojen käyttöliittymä on pitkälti tekstipohjainen. Tekoälylle annetaan tekstimuotoinen kuvaus halutusta kuvasta, jonka pohjalta algoritmi tuottaa oppimansa tiedon pohjalta omia versioitaan tekstin mukaisista kuvista. Tekoälylle voi kuvan aiheen lisäksi kuvailla myös haluamansa kuvatyylin (valokuva, maalaus, piirros, tietyn taiteilijan tyyli jne.).
Tällä hetkellä ehkä kiinnostavimmat tekoälygrafiikkageneraattorit ovat DALL-E 2, Midjourney ja Stable Diffusion.
DALL-E
DALL-E on yksi ensimmäisistä markkinoille tulleista AI-kuvageneraattoreista. Dalle-2:lla on selkeähkö käyttöliittymä, jolla on helppo kokeilla kuvien tekemistä tekoälyllä.
DALL-E 2 ”ymmärtää” hyvin melko monimutkaisiakin kuvailuja, mutta sen tuottamat kuvat eivät aina ole visuaalisesti kovin hienoja. DALL-E tarjoaa myös jonkin verran työkaluja luotujen kuvien jatkokäsittelyyn.
Midjourney
Midjourney:n käyttöliittymä perustuu hieman erikoisesti Discord-palveluun, jossa kuvat luodaan chatissä botin kanssa.
Alun oppimiskynnyksen jälkeen Midjourneyllä on helppo luoda visuaalisesti näyttäviä kuvia, vaikka sen kyky ymmärtää monimutkaisia kuvailuja onkin hieman Dall-e 2:ta heikompi.
Stable Diffusion
Edellisistä poiketen Stable Diffusion on avoimen lähdekoodin ohjelmisto, jonka voi halutessaan asentaa myös omalle tietokoneelle. Stable Diffusionin voi siten halutessaan opettaa myös omalla kuvamateriaalilla haluamansa kaltaisten kuvien luomiseen.
Käyttöönotto on kuitenkin melko hankalaa ja järjestelmä vaatii tehokkaan tietokoneen. Stable Diffusionia pääsee tosin kokeilemaan myös verkossa rajatulla demolla.
Ja monta muuta
Verkossa on tarjolla myös muita lukuisia tekoälyn perustuvia kuvageneraattoreita, kuten mm. Craiyon (aiemmin DALL-E Mini), NightCafe ja Photosonic. Myös Microsoft on juuri tuomassa markkinoille omaa Microsoft Designer -järjestelmäänsä ja Google on tehnyt julkistuksen tulevasta Imagen-AI-kuvatyökalustaan.
Tekoälymalleihin perustuva kuvien luominen on siis alue, jonka voi olettaa kehittyvän nopeasti tulevina vuosina.
Mihin tekoälykuvitus soveltuu
Edellä kuvatut työkalut eivät ole vielä kovin mukavia käyttää, mutta pienellä harjoittelulla tekoälystä saa tehokkaan työkalun grafiikan tuottamiseen. Haluttuun lopputulokseen pääseminen vaatii kokeilua ja testailua erilaisille kuvaileville teksteille, jotta tekoälyn saa ymmärtämään halutun tekstin oikein.
Usein myös tekoälyllä kannattaa teettää samasta aiheesta useita variaatioita, jolloin käyttäjä voi valita useasta kuvasta haluamansa. Työkaluille voi antaa malliksi olemassa olevia kuvia, joita palvelu hyödyntää lähdemateriaalina esim. tyylin tai yksityiskohtien oppimiseksi. Palveluille voi siis vaikkapa antaa tietyn tyylistä businessgrafiikkaa malliksi uusille samantyylisille kuville.
Tekoäly tuottaa jo nyt kohtuuhinnalla esimerkiksi blogeihin, nettisivuille ja sosiaalisen median postauksiin soveltuvia kuvituskuvia.
Toistaiseksi tekoälykuvageneraattorit ovat vielä parhaimmillaan kuvittajan työn tehostajana ja tukena ennemminkin kuin automaattisena korvaajana. Monet graafikot käyttävät tekoälyllä luotuja kuvia esim. kuvitusten taustana tai uusien kokeilujen inspiraation lähteinä. Ei kuitenkaan mene kovin monta vuotta siihen, että teknologia kehittyy entistä helppokäyttöisemmäksi ja samalla tekoälyn tuottamien kuvien laatu paranee entisestään. Jatkossa tekoälyalgoritmit korvaavat varmasti ainakin osittain erilaisten kuvapankkien käytön mm. verkkopalvelujen kuvituksessa.
Tekoälykuvitukselle (jo nyt) soveltuvia sovellusalueita:
- maisemakuvat
- henkilöhahmot, erityisesti kasvokuvat
- kuvituskuvat- ja piirrokset konkreettisista aiheista
- taideteosten tyylin mukaiset kuvat (taiteilija tai tyylisuunta)
- kuvakkeet
- detaljikuvat (mikroskooppi- tai makrokuvia jäljittelevät kuvat)
- ”hassut kuvat”: hauskat/luovat yhdistelmäkuvat, joissa yhdistetään yllättäviä asioita ja/tai tyylejä
Tekoälykuvitus ei (toistaiseksi) sovellu tilanteisiin, joissa halutaan:
- tarkasti tietyn vision mukainen kuva
- ihmiset tekemään kuvassa juuri tiettyä asiaa tai poseeraamaan juuri tietyssä asennossa
- visualisoida tarkasti jokin abstrakti konsepti
- samaan kuvaan useita eri asioita tarkasti määritetyllä tavalla
- kuva harvinaisesta asiasta, josta tekoälyllä ei ole tarpeeksi aineistoa
- tarkasti yhdenmukaisia kuvia (esim. sama ympäristö, tarkasti yhtenäinen värimaailma, tarkasti samannäköisiä hahmoja)
Kuka omistaa kuvat?
Tekoälyllä luotujen kuvien tekijänoikeuskäytäntö hakee vielä muotoaan. Periaattessa esim. DALL-E ja Midjourney antavat käyttöehdoissaan käyttäjälle hyvin vapaat oikeudet käyttää ohjelmilla tuotettuja kuvia ominaan. Tekoälyä voi siten verrata mihin tahansa muuhun taiteilijan käyttämään työvälineeseen, mutta valitettavasti asia ei ole aivan näin yksinkertainen.
Jos kuvan luomiseen käytetään tyylin tai sisällön osalta lähdeaineistona esim. jonkin taiteilijan teoksia, voidaan ajatella, että tekoälyn luoma kuva on ainakin jossain määrin kopio alkuperäisestä teoksesta. Tällöin alkuperäisellä taiteilijalla voisi ajatella olevan jonkinlainen oikeus myös uusiin hänen taiteensa pohjalta luotuihin kuviin.
Samoin, jos tekoälyllä tuotetaan tunnistetavia kuvia esim. julkisuuden henkilöistä, voisi olla asiallista pyytää henkilöltä lupa hänen kuviensa käyttöön, vaikka ne olisivatkin tekoälyn tuottamia.
Tekijänoikeudet voivat aiheuttaa myös ongelmia silloin, jos tekoälyllä tuotettuun kuvaan haluttaisiin saada yksinoikeus. Millään kun ei voi käytännössä estää, ettei joku toinen käyttäjä tuottaisi samalla ohjelmistolla hyvin samankaltaisen kuvan, jonka oikeudet taas kuuluvat uudelle tekijälle.
Immateriaalioikeuksia koskevia säädöksiä tullaan varmasti tulevaisuudessa tarkentamaan tekoälyn tuottamien aineistojen osalta. Toivottavasti jatkossa saadaan selkeät pelisäännöt, milloin tekoälyllä luotu kuva katsotaan uniikiksi teokseksi ja toisaalta, millaisia oikeuksia kuuluu tekijöille, joiden aineistoja on käytetty tekoälyn opettamiseen.
Esimerkkikuvia
Lopuksi muutama tätä juttua varten Midjourneyllä tehty esimerkkikuva, jotka voisivat soveltua kuvituskuviksi verkkoon.
Kuvat on luotu kirjoittamalla niille vain pari riviä kuvailutekstiä (esim. ”norjalainen maisema, jossa on vuono, vuoria ja vene” tai ”norjalainen 30-vuotias pariskunta”) ja jokin visuaalinen tyylimäärittely (kuten esim. ”valokuva”, ”piirroskuva”, ”maalaus”, ”kubistinen” tai ”Pixar-tyyli”).
Maisemakuvia
Ihmisiä
Yksityiskohtia
Kuvayhdistelmiä
PS. Sinua voisi kiinnostaa tulossa oleva ilmainen webinaarimme: Digitaaliset asiointipalvelut – Erilaiset konseptit ja toteutuksen eri vaihtoehdot (11.12.2024 klo 10:00). Ilmoittaudu webinaariin