Az NVIDIA elismerte, hogy a YouTube-adatokat AI-képzésre használja, ami aggályokat vet fel a szerzői jogokkal kapcsolatban

2024/08/07. - írta: MiHír

Nvidia Caught Stealing Mind-Boggling Quantity of YouTube Videos to Train AI

Nvidia lebukott a YouTube videók hozzájárulás nélküli felhasználásán az AI képzéshez

A 404 Media által kiszivárogtatott dokumentumokból kiderül, hogy az Nvidia, az AI-technológia egyik vezető chipgyártója titokban hatalmas mennyiségű YouTube-videóadatot használt fel az AI-modellek betanításához. Ez a döntés jogi és etikai kérdéseket vet fel az AI-fejlesztés során történő adatfelhasználással kapcsolatban, rávilágítva az iparág különböző vállalatainak hasonló gyakorlatára.

-

Nvidia adatszerzési törekvései

A jelentés szerint az Nvidia hatalmas mennyiségű YouTube-adatot szerzett be több AI-modell képzése céljából, többek között:
- Cosmos Deep Learning Model: Önvezető autók algoritmusaihoz használták.
- Digital Human AI Avatars: Egy AI avatar termék, amelyet az emberhez hasonló interakciók szimulálására terveztek.
- Omniverse 3D World-Building Tool: Egy eszköz részletes 3D környezetek létrehozására.

A vállalat állítólag számos virtuális gépet használva, amelyek gyakran változtatták IP-címüket, így nehezítve az adatszerzés felderítését, lépéseket tett annak érdekében, hogy tevékenységét elrejtse a YouTube elől.

-

A hozzájárulás hiánya és belső indoklás

Sem a YouTube alkotói, sem a YouTube tulajdonosa, a Google - az Nvidia fontos ügyfele - nem járult hozzá az Nvidia adatszerzéséhez. Az Nvidia belső kommunikációjából kiderült, hogy az Nvidia nemtörődöm módon állt hozzá ezekhez a tevékenységekhez, a vezetők pedig anélkül hoztak döntéseket, hogy megfelelő jóváhagyást kértek volna, vagy mérlegelték volna az etikai következményeket.

Egy májusi e-mailben Ming-Yu Liu, az Nvidia kutatási alelnöke és a Cosmos projekt egyik vezetője kijelentette: "Most véglegesítjük a v1 adatcsővezetéket és biztosítjuk a szükséges számítástechnikai erőforrásokat egy olyan videoadat-gyár létrehozásához, amely naponta egy emberi életre elegendő vizuális élményt nyújtó képzési adatot képes előállítani".

Amikor az alkalmazottak aggodalmukat fejezték ki e gyakorlat jogszerűségével és etikájával kapcsolatban, a vezetők, köztük Liu is, biztosították őket arról, hogy az akciókat a vállalat felsővezetői szentesítették. "Ez egy vezetői döntés" - írta Liu egy Slack-üzenetben az egyik alkalmazottnak, ahogy arról a 404 Media beszámolt. "Van egy ernyő jóváhagyásunk az összes adatra".

-

A tudományos adatok kereskedelmi célú felhasználása

Egy különösen aggasztó eset az Nvidia HD-VG-130M adathalmazának felhasználására vonatkozott, amely 130 millió YouTube-videóból áll, és akadémiai kutatásra szánták. Az, hogy az Nvidia ezt az adathalmazt kereskedelmi modellképzésre használta, jelentős etikai kérdéseket vet fel, mivel eltér az adathalmaz eredeti céljától.

Shayne Longpre, az MIT Media Lab doktorjelöltje így kommentálta ezt a visszaélést: "Hatalmas szakadék tátong aközött, hogy valaki beleegyezése nélkül kereskedelmi forgalomba hozunk valamit, szemben a generatív AI képességek tanulmányozásával nyilvánosan elérhető tartalmak alapján".

-

Nvidia szerepe az AI-iparban

Az Nvidia meghatározó szereplője az AI-iparágnak, különösen a számításigényes AI-rendszereket támogató GPU-jairól ismert. Az olyan AI-vállalatok, mint az OpenAI, a Microsoft, a Meta és a Google az Nvidia technológiájára támaszkodnak, így az Nvidia lépései még ellentmondásosabbak, tekintettel a Google-lal való kapcsolatára.

Amikor az Nvidia adatszerzési gyakorlatáról kérdezték, a Google szóvivője egy áprilisi interjúra hivatkozott, amelyben Neal Mohan, a YouTube vezérigazgatója hangsúlyozta, hogy a YouTube-adatok engedély nélküli felhasználása sérti a platform szolgáltatási feltételeit. Mohan kijelentette: "Amikor egy alkotó feltölti a kemény munkáját a platformunkra, bizonyos elvárásokat támasztanak vele szemben. Az egyik ilyen elvárás az, hogy a szolgáltatási feltételeket betartsák. Ez nem teszi lehetővé, hogy olyan dolgokat, mint az átiratok vagy a videódarabok letöltése, és ez egyértelműen sérti a szolgáltatási feltételeinket"."

-

Nvidia védelmi és ipari vonatkozásai

A 404 Media megállapításaira válaszul az Nvidia azt állította, hogy az AI-képzési gyakorlata megfelel a szerzői jogi törvényeknek. Az etikai következmények és a tartalomkészítők lehetséges visszahatásai azonban továbbra is aggodalomra adnak okot. Az ellentmondás rávilágít az AI-iparban jelenleg is fennálló feszültségekre, ahogy a vállalatok az adatfelhasználás, a hozzájárulás és a szellemi tulajdonjogok kihívásai között navigálnak. Az AI-térség további fejlődésével az érdekelt feleknek foglalkozniuk kell ezekkel a kérdésekkel, hogy tisztességes és átlátható gyakorlatokat alakítsanak ki, amelyek tiszteletben tartják az alkotók jogait és fenntartják a közbizalmat.

#nvidia #youtube #adatlopas

Szólj hozzá!

A bejegyzés trackback címe:

https://napimihir.blog.hu/api/trackback/id/tr9218461327

Kommentek:

A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.

Mesterséges intelligencia, robotika, kódolás

Az NVIDIA elismerte, hogy a YouTube-adatokat AI-képzésre használja, ami aggályokat vet fel a szerzői jogokkal kapcsolatban

Ajánlott bejegyzések:

A bejegyzés trackback címe:

Kommentek: