Reddit telah meluncurkan gugatan terhadap mesin pencari AI Perplexity dan tiga perusahaan data—Oxylabs UAB, AWMProxy, dan SerpApi—menuduh mereka secara ilegal menghapus kontennya untuk tujuan pelatihan AI. Gugatan hukum tersebut, yang diajukan ke Pengadilan Distrik AS untuk Distrik Selatan New York, mengklaim bahwa entitas-entitas ini melewati langkah-langkah keamanan Reddit dan Google untuk memanen hampir 3 miliar halaman hasil mesin pencari (SERP) hanya dalam dua minggu pada bulan Juli lalu.

Tuduhan Pengikisan Sistematis

Menurut gugatan tersebut, para terdakwa menggunakan taktik menipu untuk menutupi identitas dan lokasi mereka saat mengekstraksi data dari Reddit. Perusahaan tersebut menyamakan operasi tersebut dengan “calon perampok bank” yang menargetkan pengangkutan uang tunai, bukan brankas bank itu sendiri. Pengikisan agresif ini melemahkan perlindungan hak cipta Reddit, karena platform tersebut sebelumnya telah mengeluarkan surat penghentian dan penghentian kepada Perplexity setelah menelusuri data yang dicuri kembali ke mereka.

Pemain Utama dan Koneksi

Perplexity terus terdaftar sebagai klien SerpApi, bersama perusahaan teknologi besar seperti Meta, Samsung, dan Nvidia. Hal ini menyoroti tingginya permintaan data pelatihan di kalangan pengembang AI. Reddit telah mendapatkan kesepakatan lisensi dengan OpenAI dan Google tetapi juga telah melakukan tindakan hukum terhadap Anthropic atas penggunaan data yang tidak sah.

Lanskap Hukum yang Lebih Luas

Kasus ini merupakan bagian dari tren sengketa hak cipta yang semakin meningkat yang melibatkan perusahaan AI. Encyclopedia Britannica, pemilik Merriam-Webster, baru-baru ini mengajukan gugatan serupa terhadap Perplexity karena pelanggaran hak cipta. Permasalahan utamanya berkisar pada kebutuhan AI yang tak terpuaskan akan kumpulan data besar berisi konten buatan manusia—yang sebagian besar memiliki hak cipta—dan kompleksitas hukum dalam memperoleh konten tersebut.

Pertahanan Kebingungan

Perplexity berpendapat bahwa mereka tidak memerlukan perjanjian lisensi karena tidak melatih model AI dasar. Sebaliknya, dinyatakan bahwa tanggapan Reddit digunakan dalam hasil pencariannya “secara sah.” Namun, klaim ini bertentangan dengan pernyataan Reddit bahwa pengikisan tersebut dilakukan secara sistematis dan tidak sah.

Mengapa Ini Penting

Gugatan tersebut menggarisbawahi meningkatnya ketegangan antara pengembang AI dan pembuat konten terkait kepemilikan data. Reddit, dengan lebih dari 110 juta pengguna aktif setiap hari dan miliaran postingan, mewakili sumber data pelatihan yang berharga. Hasil dari kasus ini dapat menjadi preseden tentang bagaimana perusahaan AI mengakses dan memanfaatkan materi berhak cipta, sehingga berpotensi membentuk kembali masa depan lisensi data dan hak kekayaan intelektual dalam lanskap AI yang berkembang pesat.