Reddit mengutarakan sumber pendapatan selain iklan: Kesepakatan AI yang menguntungkan

Reddit mengutarakan sumber pendapatan selain iklan: Kesepakatan AI yang menguntungkan

Road.co.id

Kecerdasan buatan akan menjadi bagian penting dari bisnis Reddit Inc., kata perusahaan itu pada hari Kamis dalam pengajuan penawaran umum perdana (IPO) yang telah lama ditunggu-tunggu – memanfaatkan aliran pendapatan yang bisa menguntungkan sekaligus kontroversial.

Reddit yang berbasis di San Francisco, sebuah platform yang menampung percakapan tentang ribuan topik berbeda, menghasilkan sebagian besar uangnya dengan menjual iklan yang muncul di samping konten sosial. Dalam pengajuannya, perusahaan berusia 19 tahun tersebut menguraikan lini bisnis tambahan lainnya: menjual konten tersebut ke perusahaan yang membuat chatbot mirip ChatGPT.

Perusahaan teknologi besar, seperti Google dan OpenAI, bersedia mengeluarkan banyak uang untuk mendapatkan konten guna meningkatkan model bahasa besar mereka, perangkat lunak AI yang dibuat menggunakan kumpulan data. Pada hari Kamis, selain pengajuan publiknya, Reddit mengumumkan kesepakatan dengan Google Alphabet Inc., yang memungkinkan produk AI Google menggunakan data Reddit untuk meningkatkan teknologi mereka. Bloomberg sebelumnya telah melaporkan adanya kesepakatan AI senilai $60 juta.

“Arsip Reddit yang luas dan tak tertandingi berisi percakapan manusia yang nyata, tepat waktu, dan relevan tentang topik apa pun merupakan kumpulan data yang sangat berharga untuk berbagai tujuan, termasuk pencarian, pelatihan AI, dan penelitian,” tulis salah satu pendiri dan Chief Executive Officer Reddit Steve Huffman. dalam pengajuannya, yang menggambarkan kesepakatan tersebut sebagai “peluang baru” bagi perusahaan.

Dalam pengajuan S-1, Reddit mengatakan bahwa pada bulan Januari pihaknya menandatangani perjanjian lisensi dengan nilai agregat $203 juta, dengan jangka waktu berkisar antara dua hingga tiga tahun. Perusahaan juga mengatakan bahwa mereka memperkirakan akan menghasilkan setidaknya $66,4 juta dari kesepakatan tersebut tahun ini.

Perusahaan AI mengambil kesepakatan lisensi untuk memberikan lebih banyak konten kepada model mereka. Pada bulan Desember, OpenAI menandatangani kesepakatan senilai puluhan juta euro dengan Axel Springer SE, pemilik Politico dan Business Insider. Perjanjian semacam ini memiliki risiko besar, karena model AI sering kali melatih informasi yang dilindungi hak cipta, sehingga memperkeruh klaim kepemilikan. Misalnya, New York Times menggugat OpenAI pada bulan Desember, dengan tuduhan pelanggaran hak cipta.

Melatih model AI pada data yang dibuat pengguna – seperti host Reddit – juga memiliki risiko. Kontennya kurang akurat dibandingkan artikel berita, kata peneliti kecerdasan buatan. Reddit “pada dasarnya adalah forum tempat orang memposting apa pun,” Giada Pistilli, ahli etika utama di Hugging Face, yang membuat dan menampung model AI. “Anda dapat menemukan teori konspirasi dan segala hal bermasalah lainnya.”

Os Keyes, kandidat doktor di Universitas Washington yang mempelajari kecerdasan buatan dan etika data, mengatakan bahwa Reddit dapat memasukkan beberapa konten bermasalah ke dalam sistem AI.

“Kita telah melihat bahwa model cenderung berhalusinasi tentang fakta yang tidak ada,” kata Keyes. Mereka menunjuk pada contoh penting, pada tahun 2013, ketika pengguna Reddit secara keliru menuduh seseorang sebagai tersangka pemboman Boston Marathon. “Hal-hal yang muncul di Reddit bukanlah fakta yang tervalidasi.”

Reddit mengatakan bahwa ketika mitra menggunakan API datanya, mereka diharuskan berhenti menampilkan konten yang telah dihapus dari situs. Perusahaan tersebut menambahkan bahwa perusahaan AI telah menggunakan Reddit untuk melatih model di masa lalu tanpa membayar, dan bahwa mengorganisir kesepakatan formal akan membantunya menerapkan langkah-langkah seperti mewajibkan penghapusan konten yang telah dihapus karena pelanggaran kebijakan.

Reddit sebelumnya telah dikritik karena penanganan konten beracun dan penuh kebencian yang diposting oleh penggunanya dan sebagian besar dimoderatori oleh sukarelawan yang tidak dibayar. Pada tahun 2020, sekitar 15 tahun setelah situs tersebut didirikan, Reddit memberlakukan larangan ujaran kebencian. Dalam hal memoderasi konten bermasalah, tidak selalu jelas batasannya. Pada tahun 2021 misalnya, perusahaan menyatakan akan meninggalkan subreddit yang menyebarkan misinformasi terkait Covid-19. Beberapa hari kemudian, setelah mendapat protes dari banyak penggunanya, Reddit melarang forum tersebut, dengan mengatakan bahwa forum tersebut telah melanggar aturan lain.

Perusahaan mengatakan bahwa selain moderatornya, mereka juga memiliki tim keselamatan internal yang berdedikasi untuk menegakkan kebijakannya melalui otomatisasi dan tinjauan manusia.

Jika model AI menyerap konten yang tidak akurat, perusahaan dapat mencoba membersihkannya setelahnya, kata Pistilli, namun prosesnya bisa jadi sulit. “Itu adalah usaha yang besar dan kerja keras. Praktik yang lebih baik adalah membersihkan data Anda sebelumnya,” kata Pistilli. “Sayangnya, masyarakat lebih memilih kuantitas daripada kualitas.”

Masih terlalu dini untuk mengatakan bagaimana komunitas pengguna Reddit yang sangat vokal akan menanggapi dorongan lisensi, jika memang ada. Tahun lalu, ribuan subreddit melancarkan protes atas keputusan perusahaan untuk menaikkan harga bagi pengembang aplikasi pihak ketiga.

You might also like