Nvidia Caught Stealing Mind-Boggling Quantity of YouTube Videos to Train AI
Nvidia lebukott a YouTube videók hozzájárulás nélküli felhasználásán az AI képzéshez
A 404 Media által kiszivárogtatott dokumentumokból kiderül, hogy az Nvidia, az AI-technológia egyik vezető chipgyártója titokban hatalmas mennyiségű YouTube-videóadatot használt fel az AI-modellek betanításához. Ez a döntés jogi és etikai kérdéseket vet fel az AI-fejlesztés során történő adatfelhasználással kapcsolatban, rávilágítva az iparág különböző vállalatainak hasonló gyakorlatára.
-
Nvidia adatszerzési törekvései
A jelentés szerint az Nvidia hatalmas mennyiségű YouTube-adatot szerzett be több AI-modell képzése céljából, többek között:
- Cosmos Deep Learning Model: Önvezető autók algoritmusaihoz használták.
- Digital Human AI Avatars: Egy AI avatar termék, amelyet az emberhez hasonló interakciók szimulálására terveztek.
- Omniverse 3D World-Building Tool: Egy eszköz részletes 3D környezetek létrehozására.
A vállalat állítólag számos virtuális gépet használva, amelyek gyakran változtatták IP-címüket, így nehezítve az adatszerzés felderítését, lépéseket tett annak érdekében, hogy tevékenységét elrejtse a YouTube elől.
-
A hozzájárulás hiánya és belső indoklás
Sem a YouTube alkotói, sem a YouTube tulajdonosa, a Google - az Nvidia fontos ügyfele - nem járult hozzá az Nvidia adatszerzéséhez. Az Nvidia belső kommunikációjából kiderült, hogy az Nvidia nemtörődöm módon állt hozzá ezekhez a tevékenységekhez, a vezetők pedig anélkül hoztak döntéseket, hogy megfelelő jóváhagyást kértek volna, vagy mérlegelték volna az etikai következményeket.
Egy májusi e-mailben Ming-Yu Liu, az Nvidia kutatási alelnöke és a Cosmos projekt egyik vezetője kijelentette: "Most véglegesítjük a v1 adatcsővezetéket és biztosítjuk a szükséges számítástechnikai erőforrásokat egy olyan videoadat-gyár létrehozásához, amely naponta egy emberi életre elegendő vizuális élményt nyújtó képzési adatot képes előállítani".
Amikor az alkalmazottak aggodalmukat fejezték ki e gyakorlat jogszerűségével és etikájával kapcsolatban, a vezetők, köztük Liu is, biztosították őket arról, hogy az akciókat a vállalat felsővezetői szentesítették. "Ez egy vezetői döntés" - írta Liu egy Slack-üzenetben az egyik alkalmazottnak, ahogy arról a 404 Media beszámolt. "Van egy ernyő jóváhagyásunk az összes adatra".
-
A tudományos adatok kereskedelmi célú felhasználása
Egy különösen aggasztó eset az Nvidia HD-VG-130M adathalmazának felhasználására vonatkozott, amely 130 millió YouTube-videóból áll, és akadémiai kutatásra szánták. Az, hogy az Nvidia ezt az adathalmazt kereskedelmi modellképzésre használta, jelentős etikai kérdéseket vet fel, mivel eltér az adathalmaz eredeti céljától.
Shayne Longpre, az MIT Media Lab doktorjelöltje így kommentálta ezt a visszaélést: "Hatalmas szakadék tátong aközött, hogy valaki beleegyezése nélkül kereskedelmi forgalomba hozunk valamit, szemben a generatív AI képességek tanulmányozásával nyilvánosan elérhető tartalmak alapján".
-
Nvidia szerepe az AI-iparban
Az Nvidia meghatározó szereplője az AI-iparágnak, különösen a számításigényes AI-rendszereket támogató GPU-jairól ismert. Az olyan AI-vállalatok, mint az OpenAI, a Microsoft, a Meta és a Google az Nvidia technológiájára támaszkodnak, így az Nvidia lépései még ellentmondásosabbak, tekintettel a Google-lal való kapcsolatára.
Amikor az Nvidia adatszerzési gyakorlatáról kérdezték, a Google szóvivője egy áprilisi interjúra hivatkozott, amelyben Neal Mohan, a YouTube vezérigazgatója hangsúlyozta, hogy a YouTube-adatok engedély nélküli felhasználása sérti a platform szolgáltatási feltételeit. Mohan kijelentette: "Amikor egy alkotó feltölti a kemény munkáját a platformunkra, bizonyos elvárásokat támasztanak vele szemben. Az egyik ilyen elvárás az, hogy a szolgáltatási feltételeket betartsák. Ez nem teszi lehetővé, hogy olyan dolgokat, mint az átiratok vagy a videódarabok letöltése, és ez egyértelműen sérti a szolgáltatási feltételeinket"."
-
Nvidia védelmi és ipari vonatkozásai
A 404 Media megállapításaira válaszul az Nvidia azt állította, hogy az AI-képzési gyakorlata megfelel a szerzői jogi törvényeknek. Az etikai következmények és a tartalomkészítők lehetséges visszahatásai azonban továbbra is aggodalomra adnak okot. Az ellentmondás rávilágít az AI-iparban jelenleg is fennálló feszültségekre, ahogy a vállalatok az adatfelhasználás, a hozzájárulás és a szellemi tulajdonjogok kihívásai között navigálnak. Az AI-térség további fejlődésével az érdekelt feleknek foglalkozniuk kell ezekkel a kérdésekkel, hogy tisztességes és átlátható gyakorlatokat alakítsanak ki, amelyek tiszteletben tartják az alkotók jogait és fenntartják a közbizalmat.
#nvidia #youtube #adatlopas
A bejegyzés trackback címe:
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.