Reddit menyaman Anthropic kerana didakwa menggunakan data tapak tanpa persetujuan

Laman media sosial Reddit telah memfailkan tuntutan mahkamah terhadap syarikat permulaan AI Anthropic kerana menggunakan data tapak bekas tanpa perjanjian.

Saham Reddit melonjak selepas berita tuntutan mahkamah itu keluar.

Mengapa Reddit menyaman Anthropic?

Dalam tuntutan mahkamah itu, yang difailkan di San Francisco pada hari Rabu, syarikat media sosial itu berkata Anthropic telah melatih model AI-nya tanpa mendapatkan kebenaran atau menandatangani perkongsian dengan syarikat itu.

Reddit seterusnya menuduh Anthropic menggunakan data peribadi pengguna media sosial. Syarikat itu telah dicederakan oleh penggunaan kandungannya yang tidak dibenarkan, tambahnya.

Syarikat itu menegaskan bahawa tingkah laku Anthropic bercanggah dengan dakwaannya tentang bagaimana ia melihat dirinya sebagai "kesatria putih industri AI."

Dalam aduan itu, Reddit berkata ia telah mencuba dan gagal mencapai perjanjian dengan Anthropic. Ia menambah bahawa bot Anthropic masih cuba mengakses pelayannya selepas menyekatnya.

Reddit menambah bahawa "gergasi lain dalam ruang AI memahami menghormati peraturan Reddit," dan memetiknya sebagai sebab tapak itu membuat perjanjian dengan OpenAI dan Google untuk berkongsi datanya untuk melatih ejen AI masing-masing.

Anthropic baru-baru ini pada bulan Mei melancarkan model AI terbarunya, Claude 4.

Mengapa Syarikat AI Menginginkan Data Reddit

Nilai besar data Reddit untuk latihan AI tidak boleh dilebih-lebihkan. Dengan lebih dua dekad kandungan yang dijana pengguna, Reddit telah mengumpul arkib perbualan manusia tulen yang tiada tandingan merentasi hampir setiap topik yang boleh dibayangkan.

Dialog "dunia sebenar" ini, selalunya mentah dan tidak berwarna, ialah lombong emas untuk model AI yang ingin memahami bahasa, slanga, jenaka dan cara tidak rasmi manusia berkomunikasi.

Tidak seperti set data yang disusun susun susun atau artikel berita tradisional, kandungan Reddit menyediakan gabungan unik perspektif yang pelbagai, penyederhanaan dipacu komuniti (melalui undian naik dan undi rendah) dan perbincangan yang jujur.

Ini membolehkan model AI mempelajari bukan sahaja maklumat fakta tetapi juga sentimen, konteks dan aliran dinamik interaksi manusia.

Untuk LLM yang berusaha untuk keupayaan perbualan semula jadi, volum dan kualiti perbincangan Reddit tidak ternilai untuk meningkatkan koherensi, perkaitan dan keupayaan untuk bertindak balas kepada pertanyaan yang kompleks dan terbuka.

Tambahan pula, struktur Reddit, disusun kepada beribu-ribu subreddit yang dikhaskan untuk subjek tertentu, menawarkan sumber data yang dikategorikan dengan baik dan kaya secara topikal.

Sifat teratur ini memudahkan pembangun AI menyasarkan domain pengetahuan tertentu dan memastikan model mereka memperoleh kepakaran dalam bidang khusus.

Pada 2024, Reddit mengambil langkah untuk menghalang model AI daripada mengikis data tapak webnya. Ia telah mencipta dasar kandungan awam untuk data penggunanya yang boleh diakses secara umum.

Tawaran Terdahulu: Menetapkan Duluan

Menyedari nilai datanya yang besar, Reddit telah secara aktif meneruskan perjanjian pelesenan dengan pemain AI utama.

Tawaran ini penting untuk kepelbagaian hasil Reddit berikutan penyenaraian syarikat pada 2024.

Reddit membuat perjanjian dengan OpenAI dan Google, yang akan membolehkan syarikat-syarikat ini menggunakan data tapak.

Syarikat media sosial itu menandatangani perjanjian kira-kira $60 juta dengan Google pada Februari 2024, membolehkannya mengakses Reddit untuk melatih model seperti Gemini.

Perkongsian ini membolehkan Google memanfaatkan perbincangan meluas Reddit untuk meningkatkan keupayaan cariannya dan melatih model bahasa besar (LLM) pada maklumat terkini yang dijana manusia.

Reddit menandatangani perjanjian serupa dengan OpenAI pada Mei 2024. Perjanjian itu juga mengatakan bahawa OpenAI akan menjadi rakan kongsi pengiklanan untuk Reddit.

Ketua Pegawai Eksekutif OpenAI, Sam Altman, ialah ahli lembaga Reddit pada masa lalu. Dia masih memegang kepentingan dalam syarikat itu, dan kepentingan itu kini bernilai lebih $1 bilion.

Pada hari Rabu, saham Reddit melonjak 7% kepada $118.81.

Reddit menyaman Anthropic kerana didakwa menggunakan data tapak tanpa persetujuan

Mengapa Reddit menyaman Anthropic?

Mengapa Syarikat AI Menginginkan Data Reddit

Tawaran Terdahulu: Menetapkan Duluan

Keputusan Alphabet melepasi jangkaan apabila pertumbuhan cloud melebihi ramalan

Dow rata manakala S&P 500 dan Nasdaq turun sebelum hasil Big Tech, minyak naik

Mengapa saham Palantir jatuh 5% hari ini?

Ringkasan Petang: Ketegangan AS-Iran meningkat, Anthropic akan beli cip AMD

Saham Dell naik 9%, terima kasih kepada Super Micro Computer