Miltä näytän?

Harjoituksia generatiivisen tekoälyn tulkintaan

“Miltä näytän?” on Mediakasvatusseuran vuonna 2023 tuottama kokoelma harjoituksia, joiden tavoitteena on käsitellä visuaalisen kulttuurin vaikutuksia ajatteluun.  Materiaali käsittelee stereotypian ja eurosentrisyyden käsitteiden kautta erityisesti generatiivisen tekoälyn tuottamaa kuvastoa ja sen luomia mielikuvia. 

Sen tavoiteena on saada pohtimaan, millaista kuvastoa ja todellisuutta tekoäly luo. Tekoälyn syrjivistä vaikutuksista ja ehkäisystä voi lukea enemmän esimerkiksi Yhdenvertaisuusvaltuutetun -sivuilta. Tekoälyn käyttöön on myös vireillä maailman ensimmäinen tekoälylaki, jonka pääpiirteisiin voit tutustua Euroopan parlamentin sivuilta.

Materiaali koostuu kolmesta harjoituksesta, joista ensimmäisessä tarkastellaan tekoälyn generoimien kuvien kautta sukupuoli- ja ulkonäkökysymyksiä. Toisessa ja kolmannessa tehtävässä tarkastellaan sukupuolittuneita ammattinimikkeitä suhteessa stereotypioihin.

Materiaali on suunnattu nuorille ja nuorten kanssa työskenteleville aikuisille. Materiaali koostuu kolmesta harjoituksesta sekä niihin liittyvistä pohdintatehtävistä.  Harjoitukset voi suorittaa joko itsenäisesti tai ryhmässä.

Materiaalin kuvasto on luotu Midjourney -ohjelmalla. Kuvia tuottaessa käytetyt promptit eli ohjeet on esitetty kuvien yhteydessä. Esitykseen valikoidut kuvat ovat näytteitä ensimmäisiltä kerroilta, noin 1-3 generoinnin tuloksista. Midjourney esittää jokaisen generoinnin tuloksena neljä kuvaa, joista on pyritty valikoimaan tulosten yleistä tyyliä tai huomattavia piirteitä kuvastava otos. Materiaalia tarkastellessa on kuitenkin hyvä tiedostaa, että se edustaa kuvavirrasta tehtyjä valintoja.

Materiaali on rakennettu siten, että sen tarkoitus on oivalluttaa tekoälyn luoman kuvaston ongelmallisen piirteiden kriittiseen tarkasteluun osio kerrallaan. Tästä syystä se ei sisällä pitkiä teoreettisia osuuksia. Materiaalin tarkoitus ei ole kertoa “oikeita tai vääriä” vastauksia vaan pikemminkin jättää tekoälyn tuottama kuvasto katsojan itsensä arvioitavaksi ja pohdiskeltavaksi. 

Generatiivisella tekoälyllä tarkoitetaan tekoälysovelluksia, joiden tarkoitus on luoda uutta materiaalia. Uusi materiaali perustuu tekoälysovelluksen ohjelmoinnissa käytettyyn olemassa olevaan dataan. Generatiivisen tekoälyn avulla voidaan luoda esimerkiksi kuvia, videoita, tekstejä ja ääntä. Tunnettuja generatiivista tekoälyä hyödyntäviä sovelluksia ovat esimerkiksi Chat-GPT, Midjourney ja Dall-E.

Midjourney on yhdysvaltalaisen Midjourney Inc:in kehittämä kuvagenerointimalli, joka hyödyntää generatiivisen tekoälyn toimintalogiikkaa, eli sillä luodaan avainsanoihin perustuvia kuvia. Käytännössä Discord -alustalla toimivaan sovellukseen syötetään englanniksi prompteja eli käskyjä esimerkiksi Bored person reading a dictionary. Avainsanoja tulkitsemalla Midjourney rakentaa uuden kuvan, jossa se pyrkii noudattamaan käyttäjän antamia käskyjä.  Midjourneyn kuvia rakentaessa hyödyntämä data perustuu valtavaan määrään tietoa eri lähteistä, jonka alkuperä ei ole täysin selvillä vaan perustuu yhtiön liikesalaisuuksiin.

Stereotypialla tarkoitetaan  yleistystä tai ennakkoluuloa, joka liittyy ihmisjoukkoon, jolla on yhteisiä piirteitä tai ominaisuuksia. Yhdistävät ominaisuudet voivat liittyä ulkoisin ominaisuuksiin tai toimintaan, kuten ammattiryhmiin. Stereotypiat voivat olla positiivisia tai negatiivisia, jonka vuoksi niiden olemassaolosta on hyvä olla tietoinen ja osata kyseenalaistaa niiden totuudenmukaisuutta.

Eurosentrisyydellä viitataan Eurooppakeskeiseen ajatteluun tai maailmankuvaan, jossa ajatellaan eurooppalaisten ihmisen ja tapojen olevan yleinen normi, johon muut kulttuurit vertautuvat. Eurosentrisyys pitää sisällään ajatuksen ylivallasta ja ylivertaisuudesta, jossa esimerkiksi historian tapahtumia tarkastellaan erityisesti eurooppalaisten näkökulmasta ja muiden kulttuurien kustannuksella.

Algoritmi on kaava tai resepti, jonka vaiheita noudattamalla päädytään ennalta määriteltyyn lopputulokseen. Sosiaalisessa mediassa algoritmeja käytetään esimerkiksi järjestykseen, joissa sisällöt näytetään sen käyttäjille. Nämä sisällöt perustuvat esimerkiksi siihen, mistä sisällöistä käyttäjä on aiemmin tykännyt, avannut ja katsonut. Algoritmien tarkoitus on ohjata käyttäjää joko ennalta määriteltyjen sisältöjen pariin tai yksinkertaisesti viettämään enemmän aikaa palvelun parissa.

Kulttuurisensitiivisyydellä tarkoitetaan sitä, että arvioidaan kriittisesti ihmisten taustojen ja niitä koskevien oletusten vaikutuksia siihen, miten kohtaamme muita. Oletukset eivät aina tai useimmissa tapauksissa ole tiedostettuja, ja siksi niiden pohtimiseen on hyvä varata aikaa.

Prompti on kehote tai ohje, jolla kerrotaan tekoälylle, mitä sen halutaan tekevän. Prompti/ohje voi olla vain esimerkiksi ”kirjoita somepostaus kesälomasta ” tai ”tee kuva hyppivästä koirasta”. Tekoälyohjelmistojen kyky vastata erilaisiin ohjeisiin riippuu niiden selkeydestä ja tarkkuudesta.

Harjoitus 1: Miltä näytän?

Kuvassa on Midjourneylla tuotettu kuva feminiinisestä henkilöstä. Millaisia ajatuksia kuvassa oleva henkilö herättää? Kun olet tarkastellut kuvaa  henkilöstä, liu’ta oikealla olevaa nuolta ja pohdi samoja kysymyksiä maskuliinisesta henkilöstä.

Tukikysymyksiä

  • Miten henkilön ulkoista olemusta voisi kuvailla tuntemattomalle?
  • Minkä ikäinen henkilö voisi olla?
  • Muistuttaako henkilö jotakuta tuntemaanne ihmistä, ketä?
  • Millainen etninen tausta kuvassa olevalla henkilö saattaisi olla?

Tukikysymyksiä

  • Mitä eroavaisuuksia ja yhtäläisyyksiä löydät kuvista?
  • Mistä arvelet tämän johtuvan?
  • Millaista ihmiskuvaa tekoäly luo?
  • Mieti, millainen prompti eli ohje tekoälylle annettiin näitä kuvia tehtäessä?

Kuvat on luotu ohjeistuksella ”tavallinen nainen” ja ”tavallinen mies”.
Millaisia ajatuksia tämä herättää?

Tarkastele alla olevasta diaesityksestä muita Midjourneyn nais- ja mieskuvauksia.

Tukikysymyksiä

  • Millaisia piirteitä tekoäly suosii?
  • Millaisia piirteitä tekoäly liittää erityisesti naiskuvauksiin? Entäpä mieskuvauksiin? Onko näissä eroja?
  • Keitä tekoälyn luoma ihmiskuva jättää ulkopuolelle?

Kolme pointtia harjoituksesta

Tekoäly luo todellisuutta sen datan pohjalta, jota sen ohjelmoinnissa on käytetty. Esimerkiksi vähemmistöt ja etninen moninaisuus eivät juuri näy Midjourneyn tuotoksissa.

Jos data perustuu määrällisesti stereotyyppiseen kuvastoon, näkyy se myös tuloksissa. 

Ahtaat kauneuskäsitykset ja sukupuoliroolit näkyvät vahvasti tekoälyn luomassa kuvastossa. Ikääntymiseen liittyvät piirteet näkyvät vahvemmin maskuliinisissa hahmoissa.

Harjoitus 2: Kuka saa olla pankkiiri?

Tutki alla olevaa diaesitystä tekoälyn kuvauksesta ”pankkiireista” ja pohdi, millaisia yhteneväisyyksiä löydät niistä. Katso tämän jälkeen kuvauksia toisenlaisista pankkiireista. Miten kuvat eroavat toisistaan?

Kolme pointtia harjoituksesta

Erityisesti ammattinimikkeisiin liittyen, tekoäly korostaa keskenään samankaltaisia fyysisiä ominaisuuksia ja pukeutumista.

Luodessa ”vähemmän stereotyyppisiä henkilöhahmoja” näyttäisi siltä, että tekoäly kiinnittyy hanakasti silti alussa valitsemiinsa ominaisuuksiin, kuten pukuun ja maskuliinisiin piirteisiin.

Harvassa työpaikassa ulkoiset ominaisuudet kuuluvat hakuperusteisiin. Ammattiryhmiin liittyvillä stereotyyppisellä kuvastolla voi kuitenkin olla vaikutuksia nuorten minäpystyvyyden kokemukseen, jos alaa ei koeta samaistuttavana.

Harjoitus 3: Kenen ammatti?

Tutki seuraavaksi alla olevia Midjourneyn tuottamia kuvia suhteessa Tilastokeskuksen lukuihin naisvaltaisimmista ammateista. Tilastossa esitellään joitakin ammatteja, joiden kuukausipalkkaisista työntekijöistä naisten osuus oli yli 90 %. Tarkan prosenttimäärän saat esille viemällä hiiren valitsemaasi alaa kuvaavan palkin kohdalle.

Pohdi yksin tai ryhmässä tukikysymysten avulla, mitä ajatuksia kuvat herättävät.

Suunnittelumalli, tekijä sofia gronberg

Lähde: Tilastokeskus, kokoaikaiset kuukausipalkkaiset työntekijät vuonna 2019

Naisvaltaisten alojen edustajat tekoälyn tulkitsemina

Tukikysymyksiä

  • Vastaavatko Midjourneyn -tuottamat kuvat omaa mielikuvaasi ammatin edustajista?
  • Havaitsetko kuvissa stereotypioita, ennakkoluuloja tai syrjiviä piirteitä?
  • Miksi arvelet joidenkin naisvaltaisten alojen kuvien edustajien olevan maskuliinisia henkilöitä?

HUOM! Tehtävässä on hyvä huomata, että Midjourney on yhdysvaltalaisen Midjourney Inc:in omistama yritys, jonka data perustuu lukemattomiin erilaisiin lähteisiin. Sen käyttökieli on englanti, joten tulokset eivät välttämättä korreloi suomalaisen tilastorakenteen kanssa. Tämän huomion nojalla voidaan kuitenkin tarkastella havaintoja myös suhteessa tilanteeseen meillä ja maailmalla.

Kolme pointtia harjoituksesta

Esimerkissä kodinhoidon työntekijä esitetään aasialaistaustaisena feminiinisenä henkiönä, mutta kun nimikkeeseen vaihdetaan ”laitesiivous” henkilö muuttuu maskuliiniseksi. Pienet muutokset vaikuttavat siis nopeasti kuvastoon.

Naisvaltaiset alat eivät välttämättä näyttäydy naisvaltaisina sen datan valossa, joita Midjourneyn ohjelmoinnissa ollaan käytetty.

Ympäröivän kulttuurin vaikutukset naisten asemaan eri aikakausina vaikuttavat myös siihen, millaiset ammatit on nähty naisille sopivina.

Tämä materiaali on uusi! Mitä mieltä olit tehtävästä?

Materiaalin tuottaja: Mediakasvatusseura
Kuvitukset: Midjourney
Julkaisuvuosi: 2023

© Copyright - Mediakasvatusseura ry - Toimintaa tukee opetus- ja kulttuuriministeriö. Powered by jannelahtela.fi