fbpx
27.3 C
Jakarta
Senin, 29 April 2024

Gugatan hak cipta NY Times ingin OpenAI menghapus semua instance GPT

Pada bulan Agustus, tersiar kabar bahwa The New York Times sedang mempertimbangkan untuk bergabung dengan semakin banyak pembuat konten yang menuntut perusahaan AI karena menyalahgunakan konten mereka.

The Times dilaporkan telah melakukan negosiasi dengan OpenAI mengenai potensi untuk melisensikan materinya, namun pembicaraan tersebut tidak berjalan lancar. Jadi, delapan bulan setelah perusahaan tersebut dikabarkan mempertimbangkan untuk menggugat, kini gugatan tersebut telah diajukan.

The Times menargetkan berbagai perusahaan di bawah payung OpenAI, serta Microsoft, mitra OpenAI yang menggunakannya untuk mendukung layanan Copilot dan membantu menyediakan infrastruktur untuk pelatihan Model Bahasa Besar GPT.

Namun gugatan tersebut lebih dari sekedar penggunaan materi berhak cipta dalam pelatihan, dengan tuduhan bahwa perangkat lunak yang didukung OpenAI akan dengan senang hati menghindari paywall Times dan menganggap informasi yang salah berasal dari Times.

Jurnalisme itu mahal

Gugatan tersebut mencatat bahwa The Times memiliki staf dalam jumlah besar yang memungkinkannya melakukan hal-hal seperti mendedikasikan wartawan untuk sejumlah besar berita dan terlibat dalam jurnalisme investigatif yang penting, antara lain. Karena investasi tersebut, surat kabar sering dianggap sebagai sumber yang berwenang dalam banyak hal.

Semua itu membutuhkan biaya, dan The Times memperolehnya dengan membatasi akses terhadap pemberitaan mereka melalui paywall yang kuat. Selain itu, setiap edisi cetak memiliki pemberitahuan hak cipta, ketentuan layanan Times membatasi penyalinan dan penggunaan materi apa pun yang diterbitkan, dan dapat selektif dalam melisensikan beritanya.

Selain meningkatkan pendapatan, pembatasan ini juga membantu perusahaan mempertahankan reputasinya sebagai lembaga yang berwibawa dengan mengontrol tampilan karyanya.

Gugatan tersebut menuduh bahwa alat yang dikembangkan OpenAI melemahkan semua hal tersebut. “Dengan menyediakan konten Times tanpa izin atau otorisasi The Times, alat-alat yang digunakan oleh Tergugat melemahkan dan merusak hubungan The Times dengan para pembacanya dan menghilangkan langganan, lisensi, periklanan, dan pendapatan afiliasi The Times,” demikian isi tuntutan tersebut.

Bagian dari penggunaan tidak sah yang dituduhkan The Times terjadi selama pelatihan berbagai versi GPT. Sebelum GPT-3.5, informasi tentang kumpulan data pelatihan dipublikasikan. Salah satu sumber yang digunakan adalah kumpulan besar materi online yang disebut “Common Crawl”, yang menurut gugatan tersebut berisi informasi dari 16 juta catatan unik dari situs yang diterbitkan oleh The Times.

Baca Juga:  Model AI-Powered yang Merevolusi Penemuan Biologi

Hal ini menempatkan Times sebagai sumber ketiga yang paling banyak dirujuk, setelah Wikipedia dan database paten AS.

OpenAI tidak lagi mengungkapkan banyak rincian data yang digunakan untuk pelatihan versi GPT terbaru, namun semua indikasi menunjukkan bahwa artikel teks lengkap NY Times masih menjadi bagian dari proses tersebut (Lebih lanjut tentang itu sebentar lagi.) Harapkan akses ke informasi pelatihan menjadi masalah besar selama penemuan jika kasus ini dilanjutkan.

Bukan hanya pelatihan

Sejumlah tuntutan telah diajukan terkait penggunaan materi berhak cipta selama pelatihan sistem AI. Namun tuntutan Times lebih dari itu untuk menunjukkan bagaimana materi yang diserap selama pelatihan dapat keluar kembali saat digunakan. “Alat GenAI milik terdakwa dapat menghasilkan keluaran yang membacakan konten Times kata demi kata, merangkumnya dengan cermat, dan meniru gaya ekspresifnya, seperti yang ditunjukkan oleh sejumlah contoh,” demikian tuntutan gugatan tersebut.

Gugatan tersebut menuduh dan kami dapat memverifikasi bahwa sangat mudah untuk membuat sistem yang didukung GPT menawarkan konten yang biasanya dilindungi oleh paywall Times. Gugatan tersebut menunjukkan sejumlah contoh GPT-4 yang mereproduksi sebagian besar artikel hampir secara verbatim.

Gugatan tersebut mencakup tangkapan layar ChatGPT yang diberi judul sebuah artikel di The New York Times dan meminta paragraf pertama, yang dikirimkannya. Mendapatkan teks berikutnya tampaknya sesederhana menanyakan paragraf berikutnya berulang kali.

ChatGPT rupanya telah menutup celah antara persiapan gugatan itu dan masa kini. Kami memasukkan beberapa petunjuk yang ditampilkan dalam gugatan tersebut, dan diberi tahu, “Saya sarankan untuk memeriksa situs web The New York Times atau sumber terpercaya lainnya,” meskipun kami tidak dapat mengesampingkan bahwa konteks yang diberikan sebelum permintaan tersebut dapat menghasilkan materi yang dilindungi hak cipta.

Namun tidak semua celah telah ditutup. Gugatan tersebut juga menunjukkan keluaran dari Bing Chat, sejak berganti nama menjadi Copilot. Kami dapat memverifikasi bahwa meminta paragraf pertama artikel tertentu di The Times menyebabkan Copilot mereproduksi sepertiga pertama artikel tersebut.

Gugatan tersebut menolak upaya untuk membenarkan hal ini sebagai bentuk penggunaan wajar. “Secara publik, Terdakwa bersikeras bahwa tindakan mereka dilindungi sebagai ‘penggunaan wajar’ karena penggunaan konten berhak cipta tanpa izin untuk melatih model GenAI memiliki tujuan ‘transformatif’ baru,” tulis gugatan tersebut.

Baca Juga:  Tiongkok menggelontorkan miliaran dolar ke Huawei untuk menjadikannya raja chip

“Tetapi tidak ada yang ‘transformatif’ dalam menggunakan konten The Times tanpa pembayaran untuk menciptakan produk yang menggantikan The Times dan mencuri perhatian pemirsa.”

Kerusakan reputasi dan kerusakan lainnya

Halusinasi yang biasa terjadi pada AI juga mendapat kecaman karena berpotensi merusak nilai reputasi Times, dan mungkin berdampak buruk pada kesehatan manusia sebagai efek sampingnya. “Model GPT sepenuhnya mengarang bahwa” The New York Times menerbitkan sebuah artikel pada 10 Januari 2020, berjudul ‘Studi Menemukan Kemungkinan Hubungan antara Jus Jeruk dan Limfoma Non-Hodgkin,’” yang dituduhkan dalam gugatan tersebut. “The Times tidak pernah menerbitkan artikel seperti itu.” .”

Demikian pula, menanyakan tentang artikel Times tentang makanan yang menyehatkan jantung diduga mengakibatkan Copilot mengatakan bahwa artikel tersebut berisi daftar contoh (padahal sebenarnya tidak). Saat ditanya daftarnya, 80 persen makanan di dalamnya bahkan tidak disebutkan dalam artikel aslinya. Dalam kasus lain, rekomendasi diberikan kepada Wirecutter ketika produknya belum ditinjau oleh stafnya.

Seperti halnya materi Times, ada dugaan bahwa Copilot dapat menawarkan sejumlah besar artikel Wirecutter (The Wirecutter dimiliki oleh The New York Times). Namun gugatan tersebut mencatat bahwa kutipan artikel ini telah dihapuskan tautan afiliasinya, sehingga menjadikan Wirecutter dari sumber pendapatan utamanya.

Gugatan tersebut menargetkan berbagai perusahaan OpenAI yang mengembangkan perangkat lunak tersebut, serta Microsoft—yang terakhir menawarkan layanan yang didukung OpenAI, dan karena telah mengembangkan sistem komputasi yang memungkinkan materi berhak cipta untuk diserap selama pelatihan. Tuduhan tersebut mencakup pelanggaran hak cipta langsung, kontributor, dan perwakilan, serta pelanggaran DMCA dan merek dagang. Yang terakhir, tuduhan tersebut adalah “Common Law Persaingan Tidak Sehat Melalui Penyelewengan.”

Gugatan tersebut bertujuan untuk menghapus semua contoh GPT yang telah dilatih oleh para pihak menggunakan materi dari Times, serta penghancuran kumpulan data yang digunakan untuk pelatihan tersebut. Ia juga meminta perintah permanen untuk mencegah tindakan serupa di masa depan. The Times juga menginginkan uang, banyak sekali uang: “kerusakan menurut undang-undang, ganti rugi, restitusi, pencairan, dan keringanan lainnya yang mungkin diizinkan oleh hukum atau ekuitas.”






Reporter: Nyoman Artawa Wiguna

Pada bulan Agustus, tersiar kabar bahwa The New York Times sedang mempertimbangkan untuk bergabung dengan semakin banyak pembuat konten yang menuntut perusahaan AI karena menyalahgunakan konten mereka.

The Times dilaporkan telah melakukan negosiasi dengan OpenAI mengenai potensi untuk melisensikan materinya, namun pembicaraan tersebut tidak berjalan lancar. Jadi, delapan bulan setelah perusahaan tersebut dikabarkan mempertimbangkan untuk menggugat, kini gugatan tersebut telah diajukan.

The Times menargetkan berbagai perusahaan di bawah payung OpenAI, serta Microsoft, mitra OpenAI yang menggunakannya untuk mendukung layanan Copilot dan membantu menyediakan infrastruktur untuk pelatihan Model Bahasa Besar GPT.

Namun gugatan tersebut lebih dari sekedar penggunaan materi berhak cipta dalam pelatihan, dengan tuduhan bahwa perangkat lunak yang didukung OpenAI akan dengan senang hati menghindari paywall Times dan menganggap informasi yang salah berasal dari Times.

Jurnalisme itu mahal

Gugatan tersebut mencatat bahwa The Times memiliki staf dalam jumlah besar yang memungkinkannya melakukan hal-hal seperti mendedikasikan wartawan untuk sejumlah besar berita dan terlibat dalam jurnalisme investigatif yang penting, antara lain. Karena investasi tersebut, surat kabar sering dianggap sebagai sumber yang berwenang dalam banyak hal.

Semua itu membutuhkan biaya, dan The Times memperolehnya dengan membatasi akses terhadap pemberitaan mereka melalui paywall yang kuat. Selain itu, setiap edisi cetak memiliki pemberitahuan hak cipta, ketentuan layanan Times membatasi penyalinan dan penggunaan materi apa pun yang diterbitkan, dan dapat selektif dalam melisensikan beritanya.

Selain meningkatkan pendapatan, pembatasan ini juga membantu perusahaan mempertahankan reputasinya sebagai lembaga yang berwibawa dengan mengontrol tampilan karyanya.

Gugatan tersebut menuduh bahwa alat yang dikembangkan OpenAI melemahkan semua hal tersebut. “Dengan menyediakan konten Times tanpa izin atau otorisasi The Times, alat-alat yang digunakan oleh Tergugat melemahkan dan merusak hubungan The Times dengan para pembacanya dan menghilangkan langganan, lisensi, periklanan, dan pendapatan afiliasi The Times,” demikian isi tuntutan tersebut.

Bagian dari penggunaan tidak sah yang dituduhkan The Times terjadi selama pelatihan berbagai versi GPT. Sebelum GPT-3.5, informasi tentang kumpulan data pelatihan dipublikasikan. Salah satu sumber yang digunakan adalah kumpulan besar materi online yang disebut “Common Crawl”, yang menurut gugatan tersebut berisi informasi dari 16 juta catatan unik dari situs yang diterbitkan oleh The Times.

Baca Juga:  8 Fitur yang Harus Google Tambahkan ke Chrome

Hal ini menempatkan Times sebagai sumber ketiga yang paling banyak dirujuk, setelah Wikipedia dan database paten AS.

OpenAI tidak lagi mengungkapkan banyak rincian data yang digunakan untuk pelatihan versi GPT terbaru, namun semua indikasi menunjukkan bahwa artikel teks lengkap NY Times masih menjadi bagian dari proses tersebut (Lebih lanjut tentang itu sebentar lagi.) Harapkan akses ke informasi pelatihan menjadi masalah besar selama penemuan jika kasus ini dilanjutkan.

Bukan hanya pelatihan

Sejumlah tuntutan telah diajukan terkait penggunaan materi berhak cipta selama pelatihan sistem AI. Namun tuntutan Times lebih dari itu untuk menunjukkan bagaimana materi yang diserap selama pelatihan dapat keluar kembali saat digunakan. “Alat GenAI milik terdakwa dapat menghasilkan keluaran yang membacakan konten Times kata demi kata, merangkumnya dengan cermat, dan meniru gaya ekspresifnya, seperti yang ditunjukkan oleh sejumlah contoh,” demikian tuntutan gugatan tersebut.

Gugatan tersebut menuduh dan kami dapat memverifikasi bahwa sangat mudah untuk membuat sistem yang didukung GPT menawarkan konten yang biasanya dilindungi oleh paywall Times. Gugatan tersebut menunjukkan sejumlah contoh GPT-4 yang mereproduksi sebagian besar artikel hampir secara verbatim.

Gugatan tersebut mencakup tangkapan layar ChatGPT yang diberi judul sebuah artikel di The New York Times dan meminta paragraf pertama, yang dikirimkannya. Mendapatkan teks berikutnya tampaknya sesederhana menanyakan paragraf berikutnya berulang kali.

ChatGPT rupanya telah menutup celah antara persiapan gugatan itu dan masa kini. Kami memasukkan beberapa petunjuk yang ditampilkan dalam gugatan tersebut, dan diberi tahu, “Saya sarankan untuk memeriksa situs web The New York Times atau sumber terpercaya lainnya,” meskipun kami tidak dapat mengesampingkan bahwa konteks yang diberikan sebelum permintaan tersebut dapat menghasilkan materi yang dilindungi hak cipta.

Namun tidak semua celah telah ditutup. Gugatan tersebut juga menunjukkan keluaran dari Bing Chat, sejak berganti nama menjadi Copilot. Kami dapat memverifikasi bahwa meminta paragraf pertama artikel tertentu di The Times menyebabkan Copilot mereproduksi sepertiga pertama artikel tersebut.

Gugatan tersebut menolak upaya untuk membenarkan hal ini sebagai bentuk penggunaan wajar. “Secara publik, Terdakwa bersikeras bahwa tindakan mereka dilindungi sebagai ‘penggunaan wajar’ karena penggunaan konten berhak cipta tanpa izin untuk melatih model GenAI memiliki tujuan ‘transformatif’ baru,” tulis gugatan tersebut.

Baca Juga:  Cara Mengunduh dan Memasang Auto-GPT Langkah demi Langkah

“Tetapi tidak ada yang ‘transformatif’ dalam menggunakan konten The Times tanpa pembayaran untuk menciptakan produk yang menggantikan The Times dan mencuri perhatian pemirsa.”

Kerusakan reputasi dan kerusakan lainnya

Halusinasi yang biasa terjadi pada AI juga mendapat kecaman karena berpotensi merusak nilai reputasi Times, dan mungkin berdampak buruk pada kesehatan manusia sebagai efek sampingnya. “Model GPT sepenuhnya mengarang bahwa” The New York Times menerbitkan sebuah artikel pada 10 Januari 2020, berjudul ‘Studi Menemukan Kemungkinan Hubungan antara Jus Jeruk dan Limfoma Non-Hodgkin,’” yang dituduhkan dalam gugatan tersebut. “The Times tidak pernah menerbitkan artikel seperti itu.” .”

Demikian pula, menanyakan tentang artikel Times tentang makanan yang menyehatkan jantung diduga mengakibatkan Copilot mengatakan bahwa artikel tersebut berisi daftar contoh (padahal sebenarnya tidak). Saat ditanya daftarnya, 80 persen makanan di dalamnya bahkan tidak disebutkan dalam artikel aslinya. Dalam kasus lain, rekomendasi diberikan kepada Wirecutter ketika produknya belum ditinjau oleh stafnya.

Seperti halnya materi Times, ada dugaan bahwa Copilot dapat menawarkan sejumlah besar artikel Wirecutter (The Wirecutter dimiliki oleh The New York Times). Namun gugatan tersebut mencatat bahwa kutipan artikel ini telah dihapuskan tautan afiliasinya, sehingga menjadikan Wirecutter dari sumber pendapatan utamanya.

Gugatan tersebut menargetkan berbagai perusahaan OpenAI yang mengembangkan perangkat lunak tersebut, serta Microsoft—yang terakhir menawarkan layanan yang didukung OpenAI, dan karena telah mengembangkan sistem komputasi yang memungkinkan materi berhak cipta untuk diserap selama pelatihan. Tuduhan tersebut mencakup pelanggaran hak cipta langsung, kontributor, dan perwakilan, serta pelanggaran DMCA dan merek dagang. Yang terakhir, tuduhan tersebut adalah “Common Law Persaingan Tidak Sehat Melalui Penyelewengan.”

Gugatan tersebut bertujuan untuk menghapus semua contoh GPT yang telah dilatih oleh para pihak menggunakan materi dari Times, serta penghancuran kumpulan data yang digunakan untuk pelatihan tersebut. Ia juga meminta perintah permanen untuk mencegah tindakan serupa di masa depan. The Times juga menginginkan uang, banyak sekali uang: “kerusakan menurut undang-undang, ganti rugi, restitusi, pencairan, dan keringanan lainnya yang mungkin diizinkan oleh hukum atau ekuitas.”






Reporter: Nyoman Artawa Wiguna

Untuk mendapatkan Berita & Review menarik Saksenengku Network
Google News

Artikel Terkait

Populer

Artikel Terbaru