
Adobe, perusahaan perangkat lunak besar, tengah menghadapi gugatan hukum terkait penggunaan buku-buku bajakan untuk melatih salah satu model AI mereka yang disebut SlimLM. Model ini dikembangkan menggunakan dataset yang berasal dari koleksi buku tanpa izin dari para penulis, termasuk karya Elizabeth Lyon, seorang penulis dari Oregon.
Dataset yang digunakan bernama SlimPajama, yang merupakan hasil modifikasi dari dataset RedPajama. RedPajama sendiri dikenal berisi 191,000 buku yang telah digunakan dalam pelatihan model AI di banyak perusahaan, dan menjadi sumber banyak tuntutan hukum karena diduga melanggar hak cipta.
Kasus ini tidak hanya menimpa Adobe, karena perusahaan teknologi besar lain seperti Apple dan Salesforce juga sedang menghadapi tuduhan serupa. Bahkan, Anthropic pernah membayar 1,5 miliar dolar AS sebagai penyelesaian untuk gugatan yang sama dari para penulis.
Masalah ini mencerminkan persoalan yang tengah dihadapi industri AI, yaitu penggunaan data pelatihan yang masif namun kurang memperhatikan legalitas dan hak cipta dari sumber datanya. Perkara ini memicu diskusi penting tentang bagaimana teknologi harus dikembangkan dengan menghormati hak intelektual.
Perkembangan hukum selanjutnya diperkirakan akan lebih mengatur penggunaan dataset dalam pelatihan AI, agar keseimbangan antara inovasi teknologi dan perlindungan hak cipta para penulis dapat tercapai dengan baik.