11.12.2019 | Veflausnir

Hæfni gervigreindar til að skapa

advania colors line

Mikið hefur verið fjallað um getu gervigreindar til að skapa. Nýverið bárust til dæmis fréttir af því að gervigreind hafi lokið við að semja 10. sinfóníu Mahlers. Verkið hafði legið óklárað í meira en öld en skáldið lést frá verkinu ókláruðu.

Leifur Björnsson hugbúnaðarsérfræðingur skrifar: 

Mahler var afkastamikið tónskáld, fremur heildrænt uppkast af verkinu hafði varðveist og því nægar forsendur fyrirliggjandi til að kenna kerfinu að skapa í anda Mahlers. Þar sem forsendur gervigreindarinnar til að klára verkið voru nægar varð afraksturinn sannfærandi. Reiknigeta tölva eykst sem kunnugt er á ógnarhraða, skammtatölvan er innan seilingar og reiknigeta hliðstæð þeirri sem mannshugurinn býr yfir svo sannarlega orðinn raunhæfur möguleiki. 

Því er áhugavert að velta fyrir sér hversu mikið vægi forsendurnar hafi sem við gefum kerfunum, nú þegar við sjáum fram á að reiknigeta verði ekki lengur takmarkandi þáttur fyrir gervigreindarkerfi. Munu slík kerfi geta lært að draga ályktanir, búið til sínar eigin forsendur og umfram allt, skapað eitthvað alveg nýtt sem við skiljum og skynjum á sama hátt og listina og frumleg sköpunarverk? Þögn milli tveggja tóna getur t.d. verið mjög áhrifamikil, vakið okkur til umhugsunar og veitt okkur innblástur. Þessa skynjun og skilning getur reynst nánast ógerlegt að útskýra.

Undirritaður var svo heppinn að fá boð á spennandi tónlistarráðstefnu í Hamburg í Þýskalandi í haust. Ráðstefnan er nokkurskonar hátíð, kennd við Reeperbahn-hverfið sem helst er þekkt fyrir fjörugt næturlíf. Þar hófst ferill Bítlana fyrst af krafti árið 1960. Ráðstefnan var í upphafi hugsuð sem kaupstefna í tónlist. Þangað komu ungir og efnilegir tónlistarmenn líkt og Bítlarnir forðum og reyndu að vekja athygli tónleikabókara og útgefanda. Hélt undirritaður fyrst á Reeperbahn einmitt í þessum erindagjörðum margt fyrir löngu, með vasana fulla af draumum en litlu öðru, en árum síðar vegna sérþekkingar á streymisveitum og kerfum sem þær byggja á.

Afþreyingariðnaðurinn hefur gengið í gegnum miklar breytingar síðustu áratugi. Segja mætti að söluleiðirnar sem veðjað var á hafi engan veginn verið í takt við kröfur og þarfir neytenda. Of seint hafi verið gripið í taumana. Sjónvarps- og kvikmyndageirinn var sneggri að taka við sér með breyttum áherslum en tónlistargeirinn er loksins að sjá  viðsnúning síðustu örfá misseri. Aðallega vegna upgangs streymisveitanna. Tæknisinnaðir einstaklingar hafa ávallt leynst innan raða tónlistargeirans og almennt séð hefur þessi geiri verið mjög opinn fyrir að nýta tækninýjungar við listsköpun. Dæmin um það eru mýmörg.

Hluti Reeperbahn-tónlistarhátíðarinnar fer fram með hefðbundnara sniði þar sem framsækin fyrirtæki og einstaklingar úr ýmsum kimum skapandi greina og tónlistar, koma saman og glöggva sig á nýjustu stefnum og straumum. Nýrri tækni, nýjum möguleikum. Þessi hluti verður sífellt viðameiri og var mjög áhugaverður að þessu sinni. Einna helst sá hluti sem sneri að skapandi tækni (e. Creative Tech). Líkt og á haustráðstefnu Advania varð þátttakendum tíðrætt um gervigreind, vélnám og reiknirit og í ljósi þess sem hér á undan hefur verið rætt má nefna sérstaklega tvö áhugaverð erindi sem undirritaður sótti;

Pallborðsumræður nokkurra leiðandi aðila í tónlistargeiranum; Al music services today and tomorrow. Mun gervigreind leysa listamenn af hólmi eða aðstoða við listsköpun?

Áhugaverð sjónarmið voru sett fram, þó voru allir í grunninn sammála um að AI sé fært um ótrúlega hluti, að greina gögn, útsetja og semja tónlist. Þó var það tilfinning allra þátttakenda að gervigreindin muni aldrei verða meira en hjálpartól við sköpun raunverulegrar listar sem getur miðlað okkur einhverju nýju. Aftur á móti hefur okkur gengið mjög vel að nýta okkur tækni til að njóta listar. Sem dæmi voru teknar streymisveitur og þau reiknirit sem læra að þekkja smekk okkar og beina okkur í átt að efni sem líklegt er að okkur líki við miðað við fyrri hegðun okkar. Þessi kerfi eru löngu orðin hluti af okkar hversdagslífi og allir þekkja frá Netflix, Spotify og sambærilegum þjónustum.

Einnig flutti Alex Jacobi áhugavert erindi; How we learned not to build machines. Hann rakti niðurstöður rannsóknar sem fólst í að kanna viðbrögð neytenda við ákveðnum lagabútum, röddum og texta. Út frá þessum niðurstöðum var gervigreind notuð til að semja tónlist í auglýsingar sem ætlað var að kalla fram sömu viðbrögð hjá áhorfendum. Í stuttu máli gekk illa að ná fram sömu hughrifum áhorfenda með tónlist saminni af gervigreind og þeim sem náðust með tónlist sem samin var af mannlegum höfundum. Alex ræddi um að þar sem sköpun sé ekki skalanlegt vandamál sem hægt er að leysa með útreikningum, geti tölvur ekki orðið mjög góðar í henni. Þrátt fyrir að með tilkomu gervigreindar reiknirita séu mörg vandamál sem áður voru óleysanleg orðin leysanleg.

Stærðfræðin og útreikningar eru sem sagt í þessum skilningi gríðaröflug tæki fyrir okkur til að sanna og sýna fram á þær hugmyndir sem við vitum að eru sannar en duga mögulega skemur þegar kemur að því að fá nýjar hugmyndir eða setja fram nýjar forsendur þ.e. skapa eitthvað alveg nýtt.

Afi minn sagði mér eitt sinn frá því, þegar við horfðum upp í stjörnubjartan himin, hvernig Egyptum til forna tókst að reikna út nákvæmlega hvernig sólin snerist í kringum jörðina, þó það virtist augljóst að við á jörðinni værum í miðju alls. Nóg var að líta til himins til að sjá hvernig sólin snerist í kringum jörðina. Til að sanna þessa kenningu gátu Egyptarnir lagt fram hnökralausa útreikninga. Forsendurnar gallaðar en útreikningarnir skotheldir og niðurstaðan eftir því.
Sólmiðjukenning Aristarkosar féll fyrir daufum eyrum þegar hún kom fram og öðlaðist ekki fylgi fyrr en mörgum öldum síðar, þá sett fram af Kóperníkusi og er auðvitað algildur sannleikur í dag.

Munum við nokkurntímann geta nýtt okkur vélnám og gervigreind til að sjá útfyrir kassann og vera skapandi, þar sem öll slík kerfi munu alltaf byggja á útreikningi sem miðast við fyrirfram gefnar manngerðar forsendur? Útkoman verður alltaf afleiðing einhvers sem áður var vitað og hægt var að kenna kerfinu nægilega vel.

Í inngangi bókarinnar A=B frá árinu 1996, segir Stanford-prófessorinn og Turing-verðlaunahafinn Donald Knuth; „Science is what we understand well enough to explain to a computer. Art is everything else we do.“ (Vísindin eru það sem við skiljum nægilega vel til að geta útskýrt fyrir tölvu. List er allt annað sem við gerum), Og líklega er þetta einmitt það. Við skiljum ekki listina og áhrifin sem hún hefur á okkur nægilega vel til að geta útskýrt fyrir tölvu. Þá er hæpið að tölvan geti skilið, eða hvað þá skapað list, né heldur aðrar hugmyndir sem byggja á nýjum sannleik.

Nú sem fyrr í sögunni þegar stórkostlegar tækniframfarir verða, er rætt um sjálfvirknivæðingu starfa. Meðal annars var greint frá því í setningarræðu Haustráðstefnunnar, að allt að 375 milljón störf í heiminum þyrftu að skalast upp ef vel ætti að vera með aukinni sjálfvirknivæðingu, tilkomu gervigreindar og vélnáms. Feli sú þróun í sér að við þurfum þá í auknum mæli að efla hjá okkur skapandi og óhlutbundna hugsun til að geta fætt kerfin á nýjum sannleik og forsendum, fagna ég því ákaflega.

Höfundur er Leifur Björnsson, hugbúnaðarsérfræðingur í ráðgjöf og sérlausnum Advania. Hann hefur starfað í tónlistargeiranum í Evrópu og Bandaríkjunum og hefur m.a. sérþekkingu á tónlistarstreymisveitum.

Hér má hlusta á viðtal við Leif um sköpunarhæfni gervigreindar. 


TIL BAKA Í EFNISVEITU