A Wikipédia começou a cobrar diretamente das principais empresas de inteligência artificial (IA) – incluindo Amazon, Meta e Microsoft – pelo acesso à sua vasta base de conhecimento. Esta mudança ocorre num momento em que as empresas de IA dependem cada vez mais dos dados da Wikipédia para treinar os seus grandes modelos de linguagem (LLMs), colocando uma pressão significativa nos servidores da enciclopédia gratuita.

O problema: a tensão da IA na Wikipédia

Durante anos, a Wikipédia funcionou principalmente com base em doações públicas. No entanto, o aumento no uso de IA criou um novo desafio: Os modelos de IA consomem imensa largura de banda e recursos de computação ao extrair dados de treinamento da Wikipédia. De acordo com Jimmy Wales, fundador da Wikipédia, as empresas de IA têm “martelado” seus servidores.

Esta não é uma questão menor. A Wikipédia é uma fonte crítica de conhecimento com curadoria humana e a sua sustentabilidade depende de uma compensação justa pela sua utilização. A Wikimedia Foundation, a organização sem fins lucrativos por trás da Wikipédia, deixou claro que as doações se destinam a apoiar o acesso gratuito dos leitores, e não a subsidiar o desenvolvimento comercial de IA.

A solução: Wikipedia Enterprise

A Wikipedia agora oferece acesso comercial por meio de seu produto “Wikipedia Enterprise”. Isso permite que as empresas de IA reutilizem e distribuam legalmente o conteúdo da Wikipédia. O objetivo é simples: As empresas de IA devem contribuir financeiramente para a manutenção da plataforma da qual dependem fortemente.

A CEO Maryana Iskander observa que a dependência da Wikipédia está crescendo tanto por parte de usuários humanos quanto de ferramentas de IA, destacando a importância do financiamento sustentável.

Acordos Existentes e Implicações Futuras

A Wikipedia já tem um acordo semelhante com o Google (estabelecido em 2022) e parcerias com outras empresas de IA como Anthropic, Perplexity e Mistral AI. Wales enfatiza que as empresas de IA devem “contribuir e pagar a sua parte justa” dos custos que impõem.

Isto marca uma mudança significativa na forma como a infra-estrutura do conhecimento é financiada. A medida da Wikipédia abre um precedente: se a IA depende de dados de origem pública, aqueles que lucram com ela devem contribuir para a sua manutenção. O futuro do conhecimento livre pode depender de as empresas de IA reconhecerem a sua dependência e pagarem por ela.

Em essência, a Wikipédia afirma que o conhecimento curado por seres humanos tem valor e que aqueles que se beneficiam comercialmente devem contribuir para mantê-lo gratuito e acessível a todos.