Reddit klaagt Anthropic aan voor het naar verluidt gebruiken van de gegevens van de site zonder toestemming

Sociale-mediasite Reddit heeft een rechtszaak aangespannen tegen AI-startup Anthropic voor het gebruik van de sitegegevens van de eerste zonder overeenkomst.

Reddit-aandelen stegen nadat het nieuws van de rechtszaak naar buiten kwam.

Waarom klaagt Reddit Anthropic aan?

In de rechtszaak, die woensdag in San Francisco werd aangespannen, zei het socialemediabedrijf dat Anthropic zijn AI-modellen heeft getraind zonder toestemming te krijgen of een partnerschap met het bedrijf te ondertekenen.

Reddit beschuldigde Anthropic verder van het gebruik van de persoonlijke gegevens van gebruikers van sociale media. Het bedrijf is geschaad door het ongeoorloofde gebruik van de inhoud, voegde het eraan toe.

Het bedrijf wees erop dat het gedrag van Anthropic in tegenspraak is met zijn beweringen over hoe het zichzelf ziet als een "witte ridder van de AI-industrie".

In de klacht zei Reddit dat het had geprobeerd en er niet in was geslaagd een deal te sluiten met Anthropic. Het voegde eraan toe dat de bots van Anthropic nog steeds hebben geprobeerd toegang te krijgen tot zijn servers nadat ze waren geblokkeerd.

Reddit voegde eraan toe dat "andere reuzen in de AI-ruimte begrijpen dat ze de regels van Reddit respecteren", en noemde dit als de reden voor de site om overeenkomsten te sluiten met OpenAI en Google om zijn gegevens te delen om hun respectievelijke AI-agenten te trainen.

Anthropic onthulde onlangs in mei zijn nieuwste AI-model, Claude 4.

Waarom AI-bedrijven hunkeren naar de gegevens van Reddit

De immense waarde van de gegevens van Reddit voor AI-training kan niet genoeg worden benadrukt. Met meer dan twee decennia aan door gebruikers gegenereerde inhoud heeft Reddit een ongeëvenaard archief van authentieke menselijke gesprekken over vrijwel elk denkbaar onderwerp verzameld.

Deze 'real-world' dialoog, vaak rauw en onverbloemd, is een goudmijn voor AI-modellen die genuanceerde taal, jargon, humor en de informele manieren waarop mensen communiceren willen begrijpen.

In tegenstelling tot samengestelde datasets of traditionele nieuwsartikelen, biedt de inhoud van Reddit een unieke mix van verschillende perspectieven, door de gemeenschap aangestuurde moderatie (door middel van upvotes en downvotes) en openhartige discussies.

Hierdoor kunnen AI-modellen niet alleen feitelijke informatie leren, maar ook sentiment, context en de dynamische stroom van menselijke interactie.

Voor een LLM die streeft naar natuurlijke, conversationele mogelijkheden, zijn het enorme volume en de kwaliteit van de discussies van Reddit van onschatbare waarde voor het verbeteren van de samenhang, relevantie en het vermogen om te reageren op complexe, open vragen.

Bovendien biedt de structuur van Reddit, georganiseerd in duizenden subreddits gewijd aan specifieke onderwerpen, een goed gecategoriseerde en actueel rijke gegevensbron.

Dit georganiseerde karakter maakt het voor AI-ontwikkelaars gemakkelijker om zich te richten op specifieke kennisdomeinen en ervoor te zorgen dat hun modellen expertise verwerven in nichegebieden.

In 2024 ondernam Reddit stappen om te voorkomen dat AI-modellen de gegevens van de website zouden schrapen. Het had een beleid voor openbare inhoud opgesteld voor zijn openbaar toegankelijke gebruikersgegevens.

Eerdere deals: het precedent scheppen

Reddit erkent de enorme waarde van zijn gegevens en heeft actief licentieovereenkomsten gesloten met grote AI-spelers.

Deze deals zijn cruciaal voor de inkomstendiversificatie van Reddit na de beursgang van het bedrijf in 2024.

Reddit heeft deals gesloten met OpenAI en Google, waardoor deze bedrijven de gegevens van de site kunnen gebruiken.

Het socialemediabedrijf tekende in februari 2024 een deal van ongeveer $ 60 miljoen met Google, waardoor het toegang kreeg tot Reddit voor het trainen van modellen zoals Gemini.

Deze samenwerking stelt Google in staat om de uitgebreide discussies van Reddit te benutten om zijn zoekmogelijkheden te verbeteren en zijn grote taalmodellen (LLM's) te trainen op up-to-date, door mensen gegenereerde informatie.

Reddit tekende in mei 2024 een soortgelijke deal met OpenAI. De deal zei ook dat OpenAI een advertentiepartner voor Reddit zal worden.

De CEO van OpenAI, Sam Altman, was in het verleden bestuurslid van Reddit. Hij heeft nog steeds een belang in het bedrijf en dat belang wordt momenteel geschat op meer dan $ 1 miljard.

Op woensdag stegen de Reddit-aandelen met 7% tot $ 118,81.

Reddit klaagt Anthropic aan voor het naar verluidt gebruiken van de gegevens van de site zonder toestemming

Waarom klaagt Reddit Anthropic aan?

Waarom AI-bedrijven hunkeren naar de gegevens van Reddit

Eerdere deals: het precedent scheppen

Alphabet overtreft winstverwachtingen; cloudgroei boven prognoses

Dow vlak, S&P 500 en Nasdaq dalen voor Big Tech-winstcijfers; olie stijgt

Waarom daalt Palantir-aandeel vandaag met 5%?

Avondoverzicht: VS-Iran-spanningen nemen toe, Anthropic koopt AMD-chips

Dell-aandelen stijgen 9% dankzij Super Micro Computer