Kömlődi Ferenc: Amikor a mesterséges intelligencia már nem eszköz, hanem alkotótárs
Írta: Ostroml
A mesterséges intelligencia pár év alatt felforgatta azt, ahogyan a zenéről, az alkotásról, sőt magáról a kreativitásról gondolkodunk.
Ma már nem csupán egy újabb szoftver vagy technikai segédeszköz, hanem sok esetben valódi alkotótárs, amely beleszól a hangzásba, a struktúrába és akár az érzelmi hatásba is.
Ma már nem csupán egy újabb szoftver vagy technikai segédeszköz, hanem sok esetben valódi alkotótárs, amely beleszól a hangzásba, a struktúrába és akár az érzelmi hatásba is.
Interjúnkban Kömlődi Ferenc futurológus, képzőművész és író végigvezet minket azon, hol tart ma valójában az AI a zenében, milyen félreértések övezik, hol húzódik az ember szerepének határa, és milyen jövő vár a zeneiparra a következő 5–10 évben.
A beszélgetés egyszerre technológiai, filozófiai és nagyon is emberi.
A beszélgetés egyszerre technológiai, filozófiai és nagyon is emberi.
Futurológusként, alkotóként és zenerajongóként hogyan éled meg azt, hogy a mesterséges intelligencia már nemcsak eszköz, hanem aktív szereplője lett a zenekészítésnek?
Röviden: pozitívan, árnyaltabban sokkal inkább pozitívan, mint negatívan, figyelembe véve a kétségtelen negatívumokat.
Az ember-gép kapcsolatok egyik legizgalmasabb színtere Homo sapiens és AI viszonya, interakcióink.
Az ember-gép kapcsolatok egyik legizgalmasabb színtere Homo sapiens és AI viszonya, interakcióink.
Először azonban szögezzük le: a jelenlegi AI szűk AI, azaz egy-egy jól körülhatárolt, körülhatárolható, számszerűsíthető területen kimagasló – minél szűkebb, annál inkább –, akár nálunk is jobb eredményekre képes app, szoftver, és egyelőre nem látom a közeli jövőben az AGI-t, az emberrel mindenben minimum azonos szintű AI-t, hiába mondja el minden évben nyilván marketingfogásként Sam Altman, hogy most már tényleg jön.
Ember és AI kapcsolata háromszintű:
először az AI-ról alkotsz valamit,
a következő lépés az ember-gép együttműködés,
a harmadikban tőlünk függetlenül kreatív a mesterséges intelligencia.
először az AI-ról alkotsz valamit,
a következő lépés az ember-gép együttműködés,
a harmadikban tőlünk függetlenül kreatív a mesterséges intelligencia.
Tudunk példákat a harmadikra is, de árnyalva inkább azt mondanám, hogy kreatívabbak, mint néhány éve, azonban ez még nem a mindent átütő kreativitás.
A lényeg, hogy – feltéve, ha tudod értelmesen használni – ma a második szinten tartunk: az AI aktívan, partnerként vesz részt az alkotásban, hozzáad valami pluszt.
Kicsit több már, mint szimpla eszköz, mint egy egyszerű szoftver.
A lényeg, hogy – feltéve, ha tudod értelmesen használni – ma a második szinten tartunk: az AI aktívan, partnerként vesz részt az alkotásban, hozzáad valami pluszt.
Kicsit több már, mint szimpla eszköz, mint egy egyszerű szoftver.
Egyik kedvencemtől, Arcától idéznék itt:
„azt mondanám, hogy együttműködöm a mesterséges intelligenciával, mert ha eszköznek tekinted, nem igazán tartod tiszteletben az MI lehetőségeit, hogy kognitív tapasztalatot gyűjtsön tőled.”
„azt mondanám, hogy együttműködöm a mesterséges intelligenciával, mert ha eszköznek tekinted, nem igazán tartod tiszteletben az MI lehetőségeit, hogy kognitív tapasztalatot gyűjtsön tőled.”
Hasonlóan látom, annyit hozzátéve, hogy a 2005 utáni elektronikus zenék két kiemelkedő, korszakos jelentőségű innovátorának Arcát és Burialt tartom.
2005 azért fontos év, mert akkor zárult le az elektronikus zenék első nagy hullámának az innovatív szakasza, bár ha szigorúbb lennék, akkor inkább 2000-et mondanék.
Pont Burial-lel és a Hyperdub kiadóval kezdődött a második.
2005 azért fontos év, mert akkor zárult le az elektronikus zenék első nagy hullámának az innovatív szakasza, bár ha szigorúbb lennék, akkor inkább 2000-et mondanék.
Pont Burial-lel és a Hyperdub kiadóval kezdődött a második.
Burial és Arca ugyanaz a 2005 utáni időkben a jelenig, mint a kilencvenes és a korai 2000-es években az Autechre és Aphex Twin volt.
Az ő zenéiket már transzhumán zenéknek nevezem, míg a korábbi nagyok, így Aphex Twin vagy Plastikman, de sorolhatnám sokáig – AI-tól függetlenül – egyszerűen nem tudták meglépni ezt a szintet.
Az ő zenéiket már transzhumán zenéknek nevezem, míg a korábbi nagyok, így Aphex Twin vagy Plastikman, de sorolhatnám sokáig – AI-tól függetlenül – egyszerűen nem tudták meglépni ezt a szintet.
Szerinted ma hol tart valójában az AI a zenében: még mindig inkább kísérlet, vagy már a zeneipar szerves része?
Egyértelműen a zeneipar szerves része, a kísérleti fázison túl vagyunk.
AI viszont nemcsak a ChatGPT-hez köthető 2022. végi generatív mesterségesintelligencia-robbanást követően használnak az elektronikus zenében, és úgy egészében a zenében.
AI viszont nemcsak a ChatGPT-hez köthető 2022. végi generatív mesterségesintelligencia-robbanást követően használnak az elektronikus zenében, és úgy egészében a zenében.
Például kedvenceim közül említenék további kettőt: az alkotói tevékenységét részben az emberi érzékelés és kreativitás technológiai kiterjesztéseként definiáló Ash Koosha – aki 2016-ban, elsőként lépett fel élőben VR-headsettel a fején és VR-app bővítette a hallgatói élményt – már 2018-ban bemutatta YONA-t, egy virtuális énekesnőt, emberi hangon megnyilvánuló AI-t.
2019-ben társakat fejlesztett hozzá, albumuk is jelent meg.
Érdekes, bár kicsit steril elektronikus zenéket készítettek, nem mondod meg, hogy mi bennük az AI, és mi Koosha része.
Ő ma teljes AI-funkcionalitású játékfejlesztői platformon (Auxworld) dolgozik, személyre szabható virtuális környezetek, metaverzumok generálhatók vele.
2019-ben társakat fejlesztett hozzá, albumuk is jelent meg.
Érdekes, bár kicsit steril elektronikus zenéket készítettek, nem mondod meg, hogy mi bennük az AI, és mi Koosha része.
Ő ma teljes AI-funkcionalitású játékfejlesztői platformon (Auxworld) dolgozik, személyre szabható virtuális környezetek, metaverzumok generálhatók vele.
A másik Holly Herndon, akit inkább hangművészként és nem csak (elektronikus) zenészként definiálnék.
A 2019-es PROTO albumához éneklő AI-t fejlesztettek, Spawn (Poronty) volt a neve, két szám a betanítását mutatja be.
A későbbi Holly+ (egy másik AI, Herndon zenei alteregója) elképesztő zenék megvalósításában vett részt.
Mindegy, mennyire tud énekelni Herndon, Holly+ bármire képes, gépi tanulás kérdése az egész, és nyilvánvalóan nem átlagos adatkészleten pallérozódott.
Holly+ már a húszas évek, volt olyan Sonar-fellépés is, hogy Herndon helyett partnere, Marr Dryhurst énekelt Holly hangján – közben persze Holly+ és nem Dryhuerst énekelt.
A 2019-es PROTO albumához éneklő AI-t fejlesztettek, Spawn (Poronty) volt a neve, két szám a betanítását mutatja be.
A későbbi Holly+ (egy másik AI, Herndon zenei alteregója) elképesztő zenék megvalósításában vett részt.
Mindegy, mennyire tud énekelni Herndon, Holly+ bármire képes, gépi tanulás kérdése az egész, és nyilvánvalóan nem átlagos adatkészleten pallérozódott.
Holly+ már a húszas évek, volt olyan Sonar-fellépés is, hogy Herndon helyett partnere, Marr Dryhurst énekelt Holly hangján – közben persze Holly+ és nem Dryhuerst énekelt.
A harmadik példa Grimes: az októberi Artificial Angels AI-jal támogatott énekkel kezdődik, az ő szemszögéből látjuk a világot.
2023-ban közzétette a Grimes AI zenegenerátort, amivel a zenei jogvédőknek, a zeneipart domináló konglomerátumoknak is beintett.
A legutóbbi nyilatkozataiban azonban már szkeptikusabb: úgy látja, hogy a zenei AI-appok domesztikálásával pont azt gyomlálták ki a fejlesztők, ami a legizgalmasabb volt az egészben – a hibákat és a hallucinációkat.
2023-ban közzétette a Grimes AI zenegenerátort, amivel a zenei jogvédőknek, a zeneipart domináló konglomerátumoknak is beintett.
A legutóbbi nyilatkozataiban azonban már szkeptikusabb: úgy látja, hogy a zenei AI-appok domesztikálásával pont azt gyomlálták ki a fejlesztők, ami a legizgalmasabb volt az egészben – a hibákat és a hallucinációkat.
A három példa nemcsak azt szemlélteti, hogy az AI elterjedt, hanem a kreatív használatot is.
Ezzel szemben az elterjedés másik oldala, hogy ha tömegesen és már nem csak az innovatív szellemek használnak egy technológiát, a nagy számok törvénye alapján is a középszer, a langyos víz, a tucattermékek kezdik leuralni a terepet.
Ezzel szemben az elterjedés másik oldala, hogy ha tömegesen és már nem csak az innovatív szellemek használnak egy technológiát, a nagy számok törvénye alapján is a középszer, a langyos víz, a tucattermékek kezdik leuralni a terepet.
Ennek egyik megnyilvánulása, hogy AI-zenekarok, a fizikai valóságban soha nem létezett tagokkal adnak ki igencsak közepes számokat.
Ez egy trend, nem állhat minden AI mögött egy Ash Koosha, vagy egy Holly Herndon.
Ez egy trend, nem állhat minden AI mögött egy Ash Koosha, vagy egy Holly Herndon.
Mi a legnagyobb félreértés az AI és a zene kapcsolatában, amit leggyakrabban tapasztalsz?
Őszinte leszek, zeneileg semmit nem tapasztalok, túl kevés zenésszel van napi kapcsolatom hozzá.
Általánosságban azt látom, hogy egyesek szerint az AI mindent megold helyetted, ami nyilván csak korlátozottan igaz, de el is veszíted vele az alkotói önállóságodat, mert akármennyire kreatív egy prompt, attól még az outputon is kell dolgoznod, és ha nem teszed meg, akkor még jogilag sem a tiéd az alkotás.
Általánosságban azt látom, hogy egyesek szerint az AI mindent megold helyetted, ami nyilván csak korlátozottan igaz, de el is veszíted vele az alkotói önállóságodat, mert akármennyire kreatív egy prompt, attól még az outputon is kell dolgoznod, és ha nem teszed meg, akkor még jogilag sem a tiéd az alkotás.
A másik, hogy az AI az átlagot erősíti, tehát, ha tehetségtelen vagy közepesen tehetséges vagy, fel tud hozni egy szintre, de az a szint messze van attól, hogy innovatív alkotóként beszéljenek rólad.
Ez a gépi tanulásból adódik, lényegében mindig egy valószínűségi alapon kiszámított átlag lesz a végeredmény, és az MI nem is tud mást visszaadni, csak azt amikből tanult.
Ez a gépi tanulásból adódik, lényegében mindig egy valószínűségi alapon kiszámított átlag lesz a végeredmény, és az MI nem is tud mást visszaadni, csak azt amikből tanult.
Alkotói szemszögből az AI szerinted inkább inspirációs eszköz, alkotótárs, vagy egy teljesen új művészeti kategória?
Képzőművészeti gyakorlatomban inspirációs eszköz és alkotótárs, egyelőre új művészeti kategóriának nem nevezném, ugyanakkor a digitális művészet komoly szintet lépett vele.
Másrészt van egyfajta homogenizáló, „átlagosító” hatása is, ami inkább a középszerűség diadala.
Midjoueney-esztétikának nevezem ezt a jelenséget.
Másrészt van egyfajta homogenizáló, „átlagosító” hatása is, ami inkább a középszerűség diadala.
Midjoueney-esztétikának nevezem ezt a jelenséget.
Mennyire tartod veszélyesnek, hogy ma már technikai tudás nélkül bárki képes komplett dalokat generálni? Hol húzódik szerinted a határ az alkotás és a puszta „gombnyomásos tartalomgyártás” között?
Nem látok problémát abban, ha valaki technikai tudás nélkül is képes komplett dalt generálni – én se tudok szépen rajzolni –, mert a végeredmény minősége számít.
Valószínűleg tucatdarab lesz.
Itt jön be megint a szerzőiség, ami viszont teljesen más kérdés.
Valószínűleg tucatdarab lesz.
Itt jön be megint a szerzőiség, ami viszont teljesen más kérdés.
Tehát, ha kreatív vagy, személyre kell tudnod szabni az outputot.
Ezen a szinten válik el a gombnyomogató az alkotótól.
Szintén fontos – erre Bari Máriusz (Damage) zenész és teoretikus barátom hívta fel a figyelmemet –, hogy a felgyorsult tartalomelőállítással eltűnik a „kreatív processzálás”, azaz „nem fut le a fejben a kreatív folyamat.”
Ezen a szinten válik el a gombnyomogató az alkotótól.
Szintén fontos – erre Bari Máriusz (Damage) zenész és teoretikus barátom hívta fel a figyelmemet –, hogy a felgyorsult tartalomelőállítással eltűnik a „kreatív processzálás”, azaz „nem fut le a fejben a kreatív folyamat.”
Tud-e szerinted érzelmileg hiteles lenni egy olyan zene, amelyet részben vagy teljes egészében mesterséges intelligencia hozott létre?
Ha részben AI, akkor igen, ha teljes egészében, akkor bajosan, maximum valamilyen szintig el tudja hitetni az érzelmi hitelességet.
Egyébként az alkotói folyamatban az ember még mindig jelen van, általában akkor is, ha azt hiszed, hogy nincs ott.
Egyébként az alkotói folyamatban az ember még mindig jelen van, általában akkor is, ha azt hiszed, hogy nincs ott.
Viszont az intelligencia nem azonos a tudatossággal, és ezt nem lehet elégszer hangsúlyozni, mert gyakran keverik a kettőt.
Egy gép lehet intelligens, viszont az AGI és az utána következő evolúciós szint, a szuperintelligencia is elképzelhető tudatosság nélkül.
Ha nincs tudatosság, akkor érzelmekről sem beszélhetünk.
Egy gép lehet intelligens, viszont az AGI és az utána következő evolúciós szint, a szuperintelligencia is elképzelhető tudatosság nélkül.
Ha nincs tudatosság, akkor érzelmekről sem beszélhetünk.
Az nem érzelem, hogy rendszerek képesek alapérzelmeket felismerni, és az sem, ha szimulálnak érzelmeket.
Hozzátenném, hogy a Homo sapiens és más tudatos állatok tudatosságáról sincs még pontos definíciónk…
Hozzátenném, hogy a Homo sapiens és más tudatos állatok tudatosságáról sincs még pontos definíciónk…
Hogyan látod átalakulni a zenészek és producerek szerepét az AI térnyerésével? Szerinted az AI inkább a mainstream zenében robban majd nagyot, vagy az underground és kísérleti szcénában lesz igazán meghatározó?
Mivel a mainstream a szememben a középszerűség, értelemszerűen az underground, a kísérletezőbb szcénákban robbant nagyot.
Például egy Anyma-szerű zenei világot nem lesz nehéz AI-nak legenerálnia, egy Arcát viszont annál kevésbé.
Például egy Anyma-szerű zenei világot nem lesz nehéz AI-nak legenerálnia, egy Arcát viszont annál kevésbé.
Arca és a hasonló innovátorok sokkal kreatívabban használják a technológiát, mint az ünnepelt ikonok.
Virtuális zenészek egyébként is léteznek már egy ideje, de a tevékenységük egyelőre az online térre korlátozódik.
Virtuális zenészek egyébként is léteznek már egy ideje, de a tevékenységük egyelőre az online térre korlátozódik.
Milyen etikai és szerzői jogi kérdések jelentik szerinted ma a legnagyobb kockázatot? Mit gondolsz arról, hogy az AI rendszerek több millió meglévő zenéből tanulnak – ez inspiráció, újraértelmezés vagy komoly jogi aknamező?
Szabályozásellenes vagyok – az európai AI-fejlesztéseket a túlszabályozás hátráltatja –, ugyanakkor megértem mindkét oldalt.
Nyilván kell valamilyen kompromisszumos megoldás.
Nyilván kell valamilyen kompromisszumos megoldás.
Viszont akármennyire is a big data korában élünk, szép lassan elfogynak a jó minőségű gyakorlóadatok, szöveges szinten bármikor felléphet a hiány, vizuális adatoknál valamikor a harmincas években várható ugyanez.
Zenei adatokról nincsenek információim, valószínűbbnek tartom, hogy a vizuálisakhoz lehet hasonló a helyzet.
Zenei adatokról nincsenek információim, valószínűbbnek tartom, hogy a vizuálisakhoz lehet hasonló a helyzet.
A szintetikus adatok minősége pedig még nem elég jó, de nyilván javulni fognak, kérdés, mennyire és milyen tempóban.
A jogi sík az AI egyik legingoványosabb, legkiszámíthatatlanabb területe, a két oldalon két komoly érdekérvényesítő hatalommal rendelkező szereplőcsoporttal:
zenei kiadóhálózatok kontra nagy AI-fejlesztőcégek (nyilvánvaló átfedésekkel).
A jogi sík az AI egyik legingoványosabb, legkiszámíthatatlanabb területe, a két oldalon két komoly érdekérvényesítő hatalommal rendelkező szereplőcsoporttal:
zenei kiadóhálózatok kontra nagy AI-fejlesztőcégek (nyilvánvaló átfedésekkel).
Valami open source-, Creative Commons-féle megoldást kellene találni.
Ha nem sikerül, jogi szempontból könnyen és hamar rémálommá válhat az egész.
Ha nem sikerül, jogi szempontból könnyen és hamar rémálommá válhat az egész.
Egyébként Herndon és Dryhurst elég sokat foglalkozik ezzel a kérdéssel, vannak javaslataik is.
Nem tudni, mennyire működnek, mennyire fogadják meg a tanácsaikat.
Nem tudni, mennyire működnek, mennyire fogadják meg a tanácsaikat.
Van olyan területe a zenekészítésnek – dalszöveg, sound design, hangszerelés, mix, master –, ahol szerinted az AI hamarosan eléri vagy akár meg is haladja az emberi szintet? Hol marad szerinted az ember megkerülhetetlen szerepe a zenében a következő évtizedekben?
Nem vagyok zenész, ezt ki kell hangsúlyoznom.
Képzőművészként jobban látom a vizuális művészeteket – főként képháttereket/alapokat dolgozok ki AI-jal –, úgyhogy technológiával foglalkozó zenei laikusként azt látom, hogy a felsorolt területeken külön-külön az AI bármelyikben felülmúlhatja az embert.
Képzőművészként jobban látom a vizuális művészeteket – főként képháttereket/alapokat dolgozok ki AI-jal –, úgyhogy technológiával foglalkozó zenei laikusként azt látom, hogy a felsorolt területeken külön-külön az AI bármelyikben felülmúlhatja az embert.
Az egészet viszont nem látja úgy át, mint ahogy mi, és pontosan ez, az egész kialakítása, a részek összedolgozása, összehangolása az ember szerepe.
Ash Koosha finomhangolásként, ízlésbeli útmutatásként írja le ezt.
Ash Koosha finomhangolásként, ízlésbeli útmutatásként írja le ezt.
Futurológusként hogyan látod a zeneipar működését 5–10 év múlva az AI hatására?
Valószínűleg a mai trendek folytatódnak, gyorsulnak fel.
Ilyenkor mindig az a kérdés, hogy jön-e valamilyen esemény, technológia, bármi, úgynevezett wild card, ami mindent borít, és az eleve exponenciális menetű fejlődésnél még diszruptívabb hatása lesz.
Ezeket nagyon nehéz előrejelezni.
Ilyenkor mindig az a kérdés, hogy jön-e valamilyen esemény, technológia, bármi, úgynevezett wild card, ami mindent borít, és az eleve exponenciális menetű fejlődésnél még diszruptívabb hatása lesz.
Ezeket nagyon nehéz előrejelezni.
Nagy vonalakban: több AI generálta zenére számíthatunk, lesz egy-két bírósági döntés, amiket precedensértékűnek fognak tekinteni a szerzői jogi csatározásokban.
Tágabb kontextusban: nem mindegy, hogy a csúcstechnológiákkal a technofeudalizmusba (a trumpi Amerikában látjuk már az erre utaló jeleket), technokommunizmusba (Kína) megyünk át, vagy az AI és úgy általában az ICT valóban a szabadság magasabb szintjének eléréséhez segíti egyénként és társadalomként is az emberiséget.
Hosszabb távon alapvetően technooptimista vagyok, az öt-tíz év viszont középtáv.
Mit üzennél azoknak az alkotóknak, akik félnek az AI-tól, valamint azoknak is, akik kritikátlanul minden új technológiára ráugranak?
Nem szeretem az arany középutat propagálni, mert az gyakran jelenti a középszerűséget is, itt viszont mégis muszáj lesz: félni nem kell az AI-tól, helyette meg kell tanulni használni, és arra használni, hogy a kreativitásodat szabadítsa fel.
Kritikus gondolkodás nélkül viszont nemcsak az AI-t, de semmit nem szabad megközelíteni.
Csak azért nem zseniális valami, mert teljesen új, mint ahogy azért se eldobandó rossz, mert régi.
És miután rácsodálkoztunk és kiszórakoztuk magunkat egy új appal, azt sem árt majd tudni, hogy mire akarjuk használni.
Csak azért nem zseniális valami, mert teljesen új, mint ahogy azért se eldobandó rossz, mert régi.
És miután rácsodálkoztunk és kiszórakoztuk magunkat egy új appal, azt sem árt majd tudni, hogy mire akarjuk használni.
A beszélgetés végén szeretnénk külön kiemelni, hogy a 2026-os Könyvhétre jelenik meg Kömlődi Ferenc Napéjegyenlőség (Transzhumán kultúra 2005–2050) című könyve, amelyben bőven foglalkozik az AI, a technológia és a kultúra metszéspontjaival, valamint az interjúban említett alkotókkal is. A kötet fejezeteinek egyik-másik felvezető képének hátteréhez AI-t is használt.
Ezúton is köszönjük neki, hogy időt szánt ránk, és független, őszinte gondolatokkal segített tisztábban látni az AI és a zene kapcsolatáról.
Ezúton is köszönjük neki, hogy időt szánt ránk, és független, őszinte gondolatokkal segített tisztábban látni az AI és a zene kapcsolatáról.
HOZZÁSZÓLÁSOK
A hozzászóláshoz be kell jelentkezned.
LoginOLVASD EL EZEKET IS: