Reddit pozywa Anthropic za rzekome wykorzystanie danych witryny bez zgody

Serwis społecznościowy Reddit złożył pozew przeciwko startupowi AI Anthropic za wykorzystanie danych witryny tego pierwszego bez umowy.

Akcje Reddita wzrosły po tym, jak pojawiła się wiadomość o pozwie.

Dlaczego Reddit pozywa Anthropic?

W pozwie, który został złożony w San Francisco w środę, firma zajmująca się mediami społecznościowymi stwierdziła, że Anthropic szkoli swoje modele sztucznej inteligencji bez uzyskania pozwolenia lub podpisania partnerstwa z firmą.

Reddit dodatkowo oskarżył Anthropic o wykorzystywanie danych osobowych użytkowników mediów społecznościowych. Dodano, że firma została poszkodowana w wyniku nieautoryzowanego wykorzystania jej treści.

Firma zwróciła uwagę, że postępowanie Anthropic jest sprzeczne z jej twierdzeniami o tym, że postrzega siebie jako "białego rycerza branży AI".

W skardze Reddit powiedział, że próbował i nie udało mu się osiągnąć porozumienia z Anthropic. Dodano, że boty Anthropic nadal próbowały uzyskać dostęp do jego serwerów po ich zablokowaniu.

Reddit dodał, że "inni giganci w przestrzeni sztucznej inteligencji rozumieją zasady Reddita" i przytoczył to jako powód, dla którego witryna zawarła umowy z OpenAI i Google w celu udostępnienia swoich danych w celu szkolenia swoich agentów AI.

Firma Anthropic niedawno, w maju, zaprezentowała swój najnowszy model sztucznej inteligencji, Claude 4.

Dlaczego firmy zajmujące się sztuczną inteligencją pragną danych Reddit

Nie można przecenić ogromnej wartości danych Reddit dla szkolenia AI. Dzięki ponad dwóm dekadom treści generowanych przez użytkowników, Reddit zgromadził niezrównane archiwum autentycznych rozmów międzyludzkich na praktycznie każdy możliwy temat.

Ten dialog "w świecie rzeczywistym", często surowy i nieupiększony, jest kopalnią złota dla modeli sztucznej inteligencji, które starają się zrozumieć zniuansowany język, slang, humor i nieformalne sposoby komunikowania się ludzi.

W przeciwieństwie do wyselekcjonowanych zestawów danych lub tradycyjnych artykułów informacyjnych, treści Reddita zapewniają unikalną mieszankę różnych perspektyw, moderacji kierowanej przez społeczność (poprzez głosy w górę i w dół) oraz szczerych dyskusji.

Dzięki temu modele sztucznej inteligencji mogą uczyć się nie tylko informacji faktycznych, ale także sentymentu, kontekstu i dynamicznego przepływu interakcji międzyludzkich.

Dla LLM dążącego do naturalnych, konwersacyjnych zdolności, sama ilość i jakość dyskusji na Reddicie są nieocenione dla poprawy spójności, trafności i zdolności do odpowiadania na złożone, otwarte zapytania.

Co więcej, struktura Reddita, zorganizowana w tysiące subredditów poświęconych określonym tematom, oferuje dobrze skategoryzowane i bogate tematycznie źródło danych.

Ten zorganizowany charakter ułatwia twórcom sztucznej inteligencji kierowanie na określone dziedziny wiedzy i zapewnianie, że ich modele zdobywają wiedzę specjalistyczną w niszowych obszarach.

W 2024 roku Reddit podjął kroki, aby uniemożliwić modelom sztucznej inteligencji skrobanie danych z jego strony internetowej. Stworzył politykę treści publicznej dla swoich publicznie dostępnych danych użytkowników.

Poprzednie transakcje: Ustanawianie precedensu

Uznając ogromną wartość swoich danych, Reddit aktywnie dążył do zawarcia umów licencyjnych z głównymi graczami na rzecz sztucznej inteligencji.

Transakcje te mają kluczowe znaczenie dla dywersyfikacji przychodów Reddita po wejściu spółki na giełdę w 2024 roku.

Reddit zawarł umowy z OpenAI i Google, które pozwolą tym firmom na korzystanie z danych witryny.

Firma zajmująca się mediami społecznościowymi podpisała umowę z Google o wartości około 60 milionów dolarów w lutym 2024 roku, co umożliwiło jej dostęp do Reddita w celu szkolenia modelek takich jak Gemini.

To partnerstwo umożliwia Google wykorzystanie obszernych dyskusji Reddita w celu zwiększenia możliwości wyszukiwania i trenowania dużych modeli językowych (LLM) na aktualnych informacjach generowanych przez człowieka.

Reddit podpisał podobną umowę z OpenAI w maju 2024 roku. W umowie stwierdzono również, że OpenAI stanie się partnerem reklamowym Reddita.

Dyrektor generalny OpenAI, Sam Altman, był w przeszłości członkiem zarządu Reddita. Nadal posiada udziały w firmie, a udziały te są obecnie wyceniane na ponad 1 miliard dolarów.

W środę akcje Reddita wzrosły o 7% do 118,81 USD.

Reddit pozywa Anthropic za rzekome wykorzystanie danych witryny bez zgody

Dlaczego Reddit pozywa Anthropic?

Dlaczego firmy zajmujące się sztuczną inteligencją pragną danych Reddit

Poprzednie transakcje: Ustanawianie precedensu

Alphabet przekracza prognozy wyników, wzrost chmury przewyższa oczekiwania

Dow bez zmian, S&P 500 i Nasdaq tracą przed wynikami Big Tech, ropa rośnie

Dlaczego akcje Palantir spadają dziś o 5%?

Wieczorny przegląd: napięcia USA–Iran rosną, Anthropic kupi układy AMD

Akcje Dell rosną o 9% dzięki Super Micro Computer