AI Watchdog felkavarta az állóvizet: Madben 111 saját számát találta KI-tréning adatbázisokban
Írta: Ostroml
Egy friss oknyomozó projekt a US-Magazins The Atlantic -tól új frontot nyitott a Musikbranche vitáiban: a nyilvánosan elérhető Online-Tool segítségével bárki megnézheti, hogy dalai felbukkannak-e olyan adathalmazokban, amelyeket KI-Musikmodellen tréningezéséhez használtak. A Das Tool a AI Watchdog része, amelyet a Journalisten Alex Reisner vezet; a The Atlantic kísérő anyagként egy adatbázist is közzétett, négy, összesen több mint 21 millió dalt tartalmazó adatkészlettel. A cél: átláthatóvá tenni, milyen zenék kerültek be a mesterséges intelligencia tréninggyűjteményeibe. A listákon a pop és a rock legnagyobb nevei – Taylor Swift, Billie Eilish, a Beatles, Miles Davis vagy a Nirvana – mellett az elektronikus színtér is erősen képviselteti magát: a közzétett adatok szerint többek közt Skrillex, Peggy Gou és Bicep számai is szerepelnek bennük. A The Atlantic szerint a négyből három adatkészlet lényegében linkgyűjteményekből áll, amelyekről a dalokat automatizáltan töltötték le olyan platformokról, mint a YouTube vagy a Spotify – ez pedig a lap szerint sérti mindkét szolgáltatás felhasználási feltételeit. További kényes pont, hogy a Free Music Archive-ból több mint 100 000 tételt gyűjtött össze még 2016-ban az Eidgenössische Technische Hochschule Lausanne. A beszámoló szerint ezeket az adatokat később a Google és a Stability AI is felhasználta modellek tréningjéhez. Noha a Free Music Archive közcélú projektként működik, a művek Creative Commons licencek alatt érhetők el – ezek jelentős része pedig kifejezetten tiltja a kereskedelmi felhasználást külön engedély nélkül. Ez a körülmény tovább élesítheti a vitát az adatkészletek jogszerű kezeléséről. A kutatás hatása azonnali: SZA az AI Watchdog alapján 238 saját felvételt talált a tréningadatok között. Producer Kenny Beats az X-en ment neki a Sunónak, azt állítva, hogy a cég „megszámlálhatatlan zenésztől lop”, akik amúgy is a megélhetésükért küzdenek. A francia Techno-Producer és DJ Madben is lefuttatta a keresést: „111 saját dalomat használták fel generatív KI-tréningre a beleegyezésem nélkül. Hogy lehetséges ez?! Fuck that Shit!” – írta, amihez kommentekben sorakoztak a kritikus vélemények. Hogy a feltárt gyakorlatok milyen jogi és iparági következményekkel járnak, egyelőre nyitott kérdés. Annyi biztos, hogy a mostani publikálás ráirányította a figyelmet a KI-Training -hez használt adatkészletek eredetére, és újra napirendre tette az engedélyezés, a licencelés és az alkotói kontroll kérdését.
HOZZÁSZÓLÁSOK
A hozzászóláshoz be kell jelentkezned.
LoginOLVASD EL EZEKET IS: