Sebuah investigasi terbaru dari Proof News telah mengungkap skandal besar dalam dunia teknologi. Beberapa perusahaan teknologi besar diduga menggunakan data tanpa izin untuk melatih kecerdasan buatan mereka. Dataset yang menjadi sorotan berisi transkrip sekitar 173.000 video YouTube yang diambil dari 48.000 saluran. Data ini dikumpulkan oleh organisasi nirlaba bernama EleutherAI dan digunakan oleh perusahaan-perusahaan ternama seperti Apple, NVIDIA, dan Anthropic.
Temuan ini membuka sisi gelap dari kecerdasan buatan, di mana teknologi canggih tersebut dibangun di atas data yang dicuri dari para kreator tanpa izin atau kompensasi. Meskipun dataset tersebut tidak termasuk video atau gambar, namun berisi transkrip dari berbagai konten, termasuk milik kreator populer seperti Marques Brownlee dan MrBeast, serta media-media besar seperti The New York Times, BBC, dan ABC News. Bahkan, Engadget juga terkena dampak dalam kasus ini.
Dilansir oleh Engadget, Rabu (17/7/2024), Marques Brownlee menyatakan kekesalannya melalui platform X. Ia mengungkapkan bahwa salah satu perusahaan pemasok data untuk AI Apple telah mengambil banyak data, termasuk transkrip videonya. Ia memperkirakan bahwa masalah ini akan terus terjadi dalam jangka waktu yang lama.
Google, melalui juru bicaranya, menegaskan kembali pernyataan CEO YouTube, Neal Mohan, bahwa penggunaan data YouTube untuk melatih AI merupakan pelanggaran terhadap syarat layanan platform tersebut. Namun, Apple, NVIDIA, Anthropic, dan EleutherAI belum memberikan tanggapan atas tuduhan serius ini.