brown wooden book shelves in library

Meta Stop Lisensi Buku AI: Pelatihan Model AI Terancam Isu Hak Cipta

Table of Contents

• Meta menangguhkan lisensi buku untuk pelatihan AI generatif sejak April 2023.
• Penangguhan dipicu oleh kesulitan lisensi dan masalah hak cipta dengan penerbit.
• Meta menghadapi tuntutan hukum atas penggunaan karya berhak cipta untuk pelatihan chatbot AI.
• Meta dituduh menggunakan ‘perpustakaan bayangan’ ebook bajakan untuk pelatihan model AI Llama.
• Kesulitan lisensi data buku menghadirkan tantangan kualitas data pelatihan AI bagi Meta.
• Upaya lisensi Meta sebelumnya untuk data game engine juga mengalami kegagalan.
• Meta dan OpenAI berpendapat pelatihan AI termasuk ‘fair use’, namun ditentang pemegang hak cipta.
• Pengadilan AS dalam kasus Thomson Reuters vs. Ross Intelligence menyatakan pelatihan AI bukan ‘fair use’.
• Penangguhan lisensi buku oleh Meta dapat mengubah standar industri data pelatihan AI.
• Alternatif data pelatihan AI selain buku mungkin kurang berkualitas dan beragam.

Meta Menangguhkan Lisensi Buku untuk Pelatihan AI (Kecerdasan Buatan)

Meta telah menangguhkan kesepakatan lisensi dengan penerbit buku untuk pelatihan model AI (Artificial Intelligence atau Kecerdasan Buatan) generatif. Hal ini terungkap dalam dokumen pengadilan terkait kasus Kadrey v. Meta Platforms. Karyawan Meta mengindikasikan bahwa negosiasi lisensi data pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) untuk buku mungkin tidak scalable (terukur) karena lambatnya keterlibatan dan minat dari penerbit dan penulis. Meta menghentikan upaya lisensi pada awal April 2023 setelah berbulan-bulan kesulitan melibatkan penerbit.

Alasan penangguhan ini meliputi: Banyak penerbit tidak memiliki hak untuk melisensikan buku untuk pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan), menghambat strategi lisensi Meta. Masalah struktural dalam penerbitan, terutama kepemilikan hak, membuat pendekatan Meta tidak dapat diterapkan. Menghadapi masalah “timing” (waktu) dan kendala logistik lainnya.

Sy Choudhury, yang memimpin inisiatif kemitraan AI (Artificial Intelligence atau Kecerdasan Buatan) Meta, menyatakan bahwa upaya Meta untuk menjangkau berbagai penerbit disambut dengan “penyerapan dalam keterlibatan dan minat yang sangat lambat.” Pernyataan ini menggarisbawahi tantangan yang dihadapi Meta dalam mendapatkan data yang diperlukan untuk pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) dari sumber buku.

Tuduhan Pelanggaran Hak Cipta dan Tantangan Hukum

Meta saat ini menghadapi berbagai tuntutan hukum dari pemilik hak cipta, termasuk penulis, outlet berita, seniman, dan musisi. Tuntutan ini diajukan atas tindakan Meta yang menggunakan karya-karya mereka untuk melatih chatbot (program percakapan berbasis AI) tanpa izin atau kompensasi. Meta menjadi salah satu dari sekian banyak perusahaan AI (Artificial Intelligence atau Kecerdasan Buatan) yang menghadapi gugatan serupa terkait penggunaan materi berhak cipta untuk pelatihan chatbot (program percakapan berbasis AI). Kelompok penulis dan penerbit khawatir tentang penggunaan karya mereka untuk pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) tanpa pembayaran yang layak, dengan alasan bahwa pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) tidak selalu dapat dikategorikan sebagai ‘fair use‘ (penggunaan wajar).

Dalam pengaduan tersebut, Meta dituduh menggunakan “perpustakaan bayangan” (shadow libraries) yang berisi e-book (buku elektronik) bajakan untuk melatih beberapa model AI (Artificial Intelligence atau Kecerdasan Buatan) perusahaan, termasuk seri Llama yang populer sebagai model “terbuka” (open). Penasihat hukum penggugat mengklaim bahwa Meta melakukan referensi silang antara buku-buku bajakan tertentu dengan buku-buku berhak cipta yang tersedia untuk lisensi. Tujuannya adalah untuk menentukan apakah masuk akal untuk mengejar perjanjian lisensi dengan penerbit. Para penggugat menegaskan bahwa torrenting (mengunduh file secara ilegal) merupakan bentuk pelanggaran hak cipta.

Akibat tantangan dalam perizinan, Meta dituduh beralih menggunakan e-book (buku elektronik) bajakan dan ‘perpustakaan bayangan’ (shadow libraries) untuk pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan). Hal ini menimbulkan pertanyaan serius mengenai sumber data dan isu hak cipta. Meta diduga menggunakan metode torrenting (mengunduh file secara ilegal), menyalin buku dari perpustakaan bayangan (shadow libraries), dan menghindari perizinan yang sesuai serta kompensasi bagi penulis.

Dampak pada Pengembangan AI (Kecerdasan Buatan) dan Strategi Alternatif

Kesulitan lisensi yang dialami Meta menghadirkan tantangan teknis yang signifikan. Data alternatif yang tersedia mungkin tidak memiliki kualitas dan keragaman bahasa yang setara dengan buku. Dokumen pengadilan menunjukkan bahwa Meta menyadari perlunya menjelajahi sumber data alternatif karena kesulitan lisensi ini. Hal ini menandakan bahwa kualitas data pelatihan sangat krusial bagi pengembangan model AI (Artificial Intelligence atau Kecerdasan Buatan), dan buku memainkan peran penting dalam hal ini.

Strategi alternatif potensial yang mungkin dipertimbangkan meliputi: memulai kembali upaya lisensi dengan pendekatan yang berbeda, meningkatkan produksi data sintetis, memanfaatkan lebih banyak konten yang dibuat pengguna (user-generated content), atau menciptakan model kemitraan baru. Perusahaan AI (Artificial Intelligence atau Kecerdasan Buatan) yang lebih kecil menghadapi kerugian dibandingkan dengan raksasa teknologi karena sumber daya yang lebih sedikit untuk lisensi atau pertempuran hukum, yang berpotensi meningkatkan konsentrasi industri.

Tren ini berpotensi menetapkan standar industri baru untuk penggunaan data pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) yang etis dan legal, serta memengaruhi cara berbagai karya kreatif ditangani dalam pengembangan AI (Artificial Intelligence atau Kecerdasan Buatan). Penangguhan lisensi oleh Meta memiliki implikasi finansial bagi perusahaan dan industri AI (Artificial Intelligence atau Kecerdasan Buatan) secara keseluruhan, memengaruhi anggaran AI (Artificial Intelligence atau Kecerdasan Buatan) dan berpotensi mengurangi kualitas produk AI (Artificial Intelligence atau Kecerdasan Buatan). Tantangan yang dihadapi Meta ini tidak hanya memengaruhi pengembangan AI (Artificial Intelligence atau Kecerdasan Buatan) tetapi juga dapat mendorong perubahan industri dalam hal akuisisi konten.

Perdebatan ‘Fair Use‘ (Penggunaan Wajar) dan Preseden Hukum

Dalam deposisi Meta, terungkap bahwa beberapa staf Meta merasa negosiasi lisensi data pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) untuk buku mungkin tidak scalable (terukur). Menurut transkrip deposisi, Choudhury mencatat bahwa Meta setidaknya dalam satu kesempatan lain pernah menangguhkan upaya lisensi terkait dengan pengembangan AI (Artificial Intelligence atau Kecerdasan Buatan). Lebih lanjut, Choudhury menyebutkan upaya lisensi yang tidak berhasil sebelumnya ketika Meta mencoba melisensikan dunia 3D dari berbagai game engine (mesin permainan) dan produsen game (permainan) untuk tim riset AI (Artificial Intelligence atau Kecerdasan Buatan) mereka. Hal ini menunjukkan bahwa tantangan dalam mendapatkan data pelatihan berkualitas tinggi bukanlah isu baru bagi Meta.

Di sisi lain, OpenAI dan Meta berpendapat bahwa kewajiban pembayaran hak cipta dapat merugikan industri AI (Artificial Intelligence atau Kecerdasan Buatan) AS, yang saat ini menghadapi persaingan ketat dari Tiongkok. Perusahaan-perusahaan AI (Artificial Intelligence atau Kecerdasan Buatan) ini mengklaim bahwa pelatihan model AI (Artificial Intelligence atau Kecerdasan Buatan) menggunakan konten berhak cipta termasuk dalam kategori “fair use” (penggunaan wajar). Namun, pandangan ini tentu saja tidak disetujui oleh para pemegang hak cipta. Kasus Kadrey v. Meta Platforms secara khusus menyoroti pertanyaan penting: apakah penggunaan buku berhak cipta untuk pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) memenuhi syarat sebagai fair use (penggunaan wajar)?

Sebagai informasi tambahan, pengadilan AS telah memutuskan bahwa pelatihan AI (Artificial Intelligence atau Kecerdasan Buatan) menggunakan konten berhak cipta tidak termasuk dalam kategori fair use (penggunaan wajar) dalam kasus Thomson Reuters vs. Ross Intelligence. Putusan ini berpotensi menjadi preseden yang merugikan perusahaan-perusahaan AI (Artificial Intelligence atau Kecerdasan Buatan). Kasus Thomson Reuters v. Ross Intelligence memberikan gambaran mengenai pendekatan hakim terhadap konsep fair use (penggunaan wajar). Dalam kasus tersebut, seorang hakim federal memutuskan bahwa Ross Intelligence tidak dapat menyalin materi Thomson Reuters untuk platform hukum berbasis AI (Artificial Intelligence atau Kecerdasan Buatan) mereka. Keputusan ini mengindikasikan bahwa pengadilan cenderung berhati-hati dalam menerapkan doktrin fair use (penggunaan wajar) dalam konteks pengembangan AI (Artificial Intelligence atau Kecerdasan Buatan).

Leave a Reply

Your email address will not be published. Required fields are marked *