Reddit heeft een rechtszaak aangespannen tegen de AI-zoekmachine Perplexity en drie databedrijven – Oxylabs UAB, AWMProxy en SerpApi – die hen ervan beschuldigen de inhoud illegaal te schrappen voor AI-trainingsdoeleinden. De juridische actie, ingediend bij de Amerikaanse rechtbank voor het zuidelijke district van New York, beweert dat deze entiteiten afgelopen juli de beveiligingsmaatregelen van Reddit en Google hebben omzeild en in slechts twee weken tijd bijna 3 miljard zoekresultatenpagina’s (SERP’s) van zoekmachines hebben verzameld.

Beschuldigingen van systematisch schrapen

Volgens de rechtszaak gebruikten de beklaagden misleidende tactieken om hun identiteit en locatie te maskeren terwijl ze gegevens uit Reddit haalden. Het bedrijf vergeleek de operatie met “zogenaamde bankovervallers” die zich richtten op het geldtransport in plaats van op de bankkluis zelf. Dit agressieve schrapen ondermijnt de auteursrechtbescherming van Reddit, aangezien het platform eerder een last-en-ophouden-brief aan Perplexity heeft gestuurd nadat het de gestolen gegevens naar hen heeft teruggeleid.

Belangrijkste spelers en connecties

Perplexity wordt nog steeds vermeld als klant van SerpApi, naast grote technologiebedrijven als Meta, Samsung en Nvidia. Dit benadrukt de grote vraag naar trainingsgegevens onder AI-ontwikkelaars. Reddit heeft al licentieovereenkomsten afgesloten met OpenAI en Google, maar heeft ook juridische stappen ondernomen tegen Anthropic vanwege ongeoorloofd datagebruik.

Breder juridisch landschap

Deze zaak maakt deel uit van een groeiende trend van auteursrechtgeschillen waarbij AI-bedrijven betrokken zijn. Encyclopedia Britannica, eigenaar van Merriam-Webster, heeft onlangs een soortgelijke rechtszaak aangespannen tegen Perplexity wegens inbreuk op het auteursrecht. Het kernprobleem draait om de onverzadigbare behoefte van AI aan enorme datasets met door mensen gegenereerde inhoud – waarvan een groot deel auteursrechtelijk beschermd is – en de juridische complexiteit van het verkrijgen van die inhoud.

De verdediging van perplexiteit

Perplexity stelt dat er geen licentieovereenkomsten nodig zijn omdat er geen fundamentele AI-modellen worden getraind. In plaats daarvan stelt het dat Reddit-reacties ‘rechtmatig’ in de zoekresultaten worden gebruikt. Deze bewering staat echter op gespannen voet met de bewering van Reddit dat het schrapen systematisch en ongeoorloofd was.

Waarom dit belangrijk is

De rechtszaak onderstreept de escalerende spanning tussen AI-ontwikkelaars en makers van inhoud over het eigendom van data. Reddit vertegenwoordigt, met meer dan 110 miljoen dagelijks actieve gebruikers en miljarden berichten, een waardevolle bron van trainingsgegevens. De uitkomst van deze zaak zou precedenten kunnen scheppen voor de manier waarop AI-bedrijven toegang krijgen tot en gebruik maken van auteursrechtelijk beschermd materiaal, waardoor de toekomst van datalicenties en intellectuele eigendomsrechten in het snel evoluerende AI-landschap mogelijk opnieuw wordt vormgegeven.