Reddit haastaa Anthropicin oikeuteen, koska sen väitetään käyttäneen sivuston tietoja ilman lupaa

Sosiaalisen median sivusto Reddit on nostanut kanteen tekoälystartup Anthropicia vastaan, koska se on käyttänyt ensin mainitun sivustotietoja ilman sopimusta.

Redditin osakkeet nousivat sen jälkeen, kun uutinen oikeusjutusta tuli julki.

Miksi Reddit haastaa Anthropicin oikeuteen?

San Franciscossa keskiviikkona nostetun kanteessa sosiaalisen median yhtiö sanoi, että Anthropic on kouluttanut tekoälymallejaan ilman lupaa tai kumppanuutta yrityksen kanssa.

Reddit syytti lisäksi Anthropicia sosiaalisen median käyttäjien henkilötietojen käytöstä. Yhtiö on kärsinyt sen sisällön luvattomasta käytöstä, se lisäsi.

Yhtiö huomautti, että Anthropicin toiminta on ristiriidassa sen väitteiden kanssa siitä, kuinka se näkee itsensä "tekoälyteollisuuden valkoisena ritarina".

Valituksessa Reddit sanoi, että se oli yrittänyt päästä sopimukseen Anthropicin kanssa, mutta epäonnistunut. Se lisäsi, että Anthropicin botit ovat edelleen yrittäneet käyttää sen palvelimia estämisen jälkeen.

Reddit lisäsi, että "muut tekoälyalan jättiläiset ymmärtävät Redditin sääntöjä", ja mainitsi sen syynä siihen, että sivusto teki sopimuksia OpenAI:n ja Googlen kanssa tietojensa jakamisesta tekoälyagenttiensa kouluttamiseksi.

Anthropic esitteli äskettäin toukokuussa uusimman tekoälymallinsa, Claude 4:n.

Miksi tekoälyyritykset kaipaavat Redditin dataa

Redditin datan valtavaa arvoa tekoälykoulutuksessa ei voi liioitella. Yli kahden vuosikymmenen käyttäjien luoman sisällön ansiosta Reddit on kerännyt vertaansa vailla olevan arkiston aitoja inhimillisiä keskusteluja käytännössä kaikista kuviteltavissa olevista aiheista.

Tämä "tosielämän" dialogi, joka on usein raaka ja kaunistelematon, on kultakaivos tekoälymalleille, jotka pyrkivät ymmärtämään vivahteikasta kieltä, slangia, huumoria ja epävirallisia tapoja kommunikoida.

Toisin kuin kuratoidut tietojoukot tai perinteiset uutisartikkelit, Redditin sisältö tarjoaa ainutlaatuisen sekoituksen erilaisia näkökulmia, yhteisölähtöistä moderointia (plus- ja down-äänten kautta) ja rehellisiä keskusteluja.

Näin tekoälymallit voivat oppia faktatiedon lisäksi myös tunteita, kontekstia ja ihmisten välisen vuorovaikutuksen dynaamista kulkua.

Luonnollisiin, keskustelukykyihin pyrkivälle LLM:lle Redditin keskustelujen pelkkä määrä ja laatu ovat korvaamattomia johdonmukaisuuden, osuvuuden ja kyvyn parantaa monimutkaisiin, avoimiin kyselyihin vastaamista.

Lisäksi Redditin rakenne, joka on järjestetty tuhansiin tietyille aiheille omistettuihin subredditteihin, tarjoaa hyvin luokitellun ja aiherikkaan tietolähteen.

Tämä järjestäytynyt luonne helpottaa tekoälykehittäjien kohdistamista tiettyihin osaamisalueisiin ja varmistaa, että heidän mallinsa saavat asiantuntemusta kapeilta alueilta.

Vuonna 2024 Reddit ryhtyi toimiin estääkseen tekoälymalleja kaapimasta verkkosivustonsa tietoja. Se oli luonut julkisen sisällön käytännön julkisesti saatavilla oleville käyttäjätiedoilleen.

Aiemmat sopimukset: ennakkotapauksen luominen

Reddit on tunnustanut tietojensa valtavan arvon ja on aktiivisesti pyrkinyt lisenssisopimuksiin suurten tekoälytoimijoiden kanssa.

Nämä sopimukset ovat ratkaisevan tärkeitä Redditin tulojen monipuolistamiselle yhtiön listautumisen jälkeen vuonna 2024.

Reddit teki sopimuksia OpenAI:n ja Googlen kanssa, mikä antaa näille yrityksille mahdollisuuden käyttää sivuston tietoja.

Sosiaalisen median yritys allekirjoitti helmikuussa 2024 noin 60 miljoonan dollarin sopimuksen Googlen kanssa, mikä antaa sille pääsyn Redditiin Geminin kaltaisten mallien kouluttamiseen.

Tämän kumppanuuden ansiosta Google voi hyödyntää Redditin laajoja keskusteluja parantaakseen hakuominaisuuksiaan ja kouluttaakseen suuria kielimallejaan (LLM) ajantasaisella, ihmisen luomalla tiedolla.

Reddit allekirjoitti samanlaisen sopimuksen OpenAI:n kanssa toukokuussa 2024. Sopimuksessa sanottiin myös, että OpenAI:sta tulee Redditin mainoskumppani.

OpenAI:n toimitusjohtaja Sam Altman oli aiemmin Redditin hallituksen jäsen. Hänellä on edelleen osuus yhtiöstä, ja osuuden arvo on tällä hetkellä yli 1 miljardi dollaria.

Keskiviikkona Redditin osakkeet nousivat 7 % 118,81 dollariin.

Reddit haastaa Anthropicin oikeuteen, koska sen väitetään käyttäneen sivuston tietoja ilman lupaa

Miksi Reddit haastaa Anthropicin oikeuteen?

Miksi tekoälyyritykset kaipaavat Redditin dataa

Aiemmat sopimukset: ennakkotapauksen luominen

Alphabet ylitti ennusteet – pilvikasvu yllätti odotukset

Dow tasaantuu, S&P 500 ja Nasdaq laskevat ennen Big Tech -tuloksia, öljy nousee

Miksi Palantirin osake putoaa 5 % tänään?

Iltakatsaus: Yhdysvaltojen ja Iranin jännitteet kasvavat, Anthropic ostaa AMD‑piirejä

Dellin osake nousi 9% – Super Micro Computerin ansiosta