Cikkek: 25480 | Ma megjelent: 15
onemusic logo

Négy Giant Datasets köré szerveződik a zenés AI-tanítás? Alex Reisner új cikke kérdéseket vet fel

Írta: Ostroml

A The Atlantic munkatársa, Alex Reisner vizsgálata szerint a zenegeneráló modellek képzésében négy „Giant Datasets” kering az AI-development közegben, amelyeket egymás között megosztanak a szereplők. Ezek összesen több mint 22 millió hangfelvételt tartalmaznak: két, nagyjából 100,000 számos gyűjtemény mellett egy 9.7 milliós és egy 12.3 milliós adatbázisról ír a cikk. A képzési mennyiségeket – „training numbers” – a közelmúltban Udio és Suno is igyekezett eltitkolni, így a nyers darabszámok és az aktív tanítás tényleges köre továbbra sem átlátható. A legnagyobb adatbázist a német LAION tette közzé, a második legnagyobbat pedig a Sleeping AI-hoz köthető kutatók állították össze – írja a The Atlantic. Az egyik 100,000 -számos csomag a Free Music Archive , amelyből állítólag a Google és a Stability AI is merített. A többi halmaz konkrét felhasználóiról a cikk szerint „az iparág titkolózása” miatt nincs bizonyosság, annyi viszont látszik, hogy a négy adatbázist összesen ezerszám töltötték le. Egy dataset-kereső eszköz alapján az is beazonosítható, mely előadók dalai szerepelnek ezekben a könyvtárakban. A két legnagyobb csomagban például nagyjából 300 Beatles-szám is ott van, és több száz felvétel Taylor Swift , ABBA , Snoop Dogg vagy Michael Jackson katalógusából. A listák nem csak örökzöld slágereket tartalmaznak: a cikk szerint rengeteg független előadó kiváló anyagai is bekerültek, jóllehet ezeket „tízezernyi kisebb előadó” anyagaiként bagatellizálják. Miközben a zenés AI-platformok több perrel is szembenéznek szerzői jogi kérdésekben, érdemes a méretarányokat is figyelembe venni: a két legnagyobb adatbázis együtt is a Spotify teljes katalógusának kevesebb mint 9%-át teszi ki, Gustav Söderström társigazgató és más források becslései alapján. Nem világos, pontosan hogyan álltak össze ezek a válogatások, de aligha véletlenszerű gyűjtésekről van szó – és ez adja a jelentés tétjét: a képzési folyamat a jelek szerint sokkal szelektívebb és szervezettebb lehet annál, mint amit eddig feltételeztünk.
Találj egy eseméyt

Böngéssz az események között, és szerezz új élményeket!

Események
Töltsd fel az eseményedet

Értékesítsd a jegyeidet a OneTicketen!

Esemény létrehozása
HOZZÁSZÓLÁSOK

A hozzászóláshoz be kell jelentkezned.

Login
OLVASD EL EZEKET IS:

REKLÁM

OneTicket