LLMs

Encyclopedia Britannica is suing OpenAI for allegedly ‘memorizing’ its content with ChatGPT

Publicado porRedacao AIDaily
2 min de leitura
Autor na fonte original: Stevie Bonifield

On Friday, Encyclopedia Britannica and dictionary publisher Merriam-Webster filed a lawsuit against OpenAI alleging that it used their copyrighted content to train its AI, then generated responses that were "substantially similar" to their content, as previously reported by Reuters. According to Britannica, OpenAI repeatedly copied its content without permission, stating, "GPT-4 itself has 'memorized' much […]

Compartilhar:

The lawsuit accuses OpenAI of outputting near-identical copies of Britannica and Merriam-Webster’s content.

The lawsuit accuses OpenAI of outputting near-identical copies of Britannica and Merriam-Webster’s content.

On Friday, Encyclopedia Britannica and dictionary publisher Merriam-Webster filed a lawsuit against OpenAI alleging that it used their copyrighted content to train its AI, then generated responses that were “substantially similar” to their content, as previously reported by Reuters .

According to Britannica, OpenAI repeatedly copied its content without permission, stating, “GPT-4 itself has ‘memorized’ much of Britannica’s copyrighted content and will output near-verbatim copies of significant portions on demand. The memorized examples are unauthorized copies that [OpenAI] used to train their models, including GPT-4.”

The lawsuit goes on to include examples of responses from OpenAI’s models side-by-side with Britannica’s text, in which entire passages appear to match word-for-word. Britannica also claims that OpenAI has been “cannibalizing” its web traffic by generating responses that “substitute, or directly compete” with Britannica’s content, rather than directing users to its website the way a traditional search engine would.

It’s the latest in a growing series of copyright lawsuits from publishers aimed at AI companies over the past several years. The New York Times has made similar claims in its ongoing lawsuit against OpenAI , including accusing the AI company of copying mass amounts of its copyrighted content. In September, Anthropic settled a class action lawsuit for using copyrighted books to train its AI models, resulting in a $1.5 billion payout to the books’ authors.

European retailers yank popular headphones after study reports trace amounts of hormone-disrupting chemicals

Meta is reportedly laying off up to 20 percent of its staff

Apple’s $549 AirPods Max 2 add better ANC and live translation

MacBook Air M5 review: a small update for the ‘just right’ Mac

The $100,000 fee for H-1Bs is causing all sorts of problems

Pontos-chave

  • A ação judicial destaca a crescente preocupação com o uso não autorizado de conteúdo protegido por IA.
  • O caso pode impactar a sustentabilidade financeira de veículos de mídia ao canibalizar seu tráfego.
  • O desfecho pode estabelecer precedentes importantes para futuras interações entre empresas de IA e criadores de conteúdo.

Análise editorial

A ação judicial da Encyclopedia Britannica e da Merriam-Webster contra a OpenAI representa um marco significativo nas discussões sobre direitos autorais e o uso de conteúdo protegido em modelos de inteligência artificial. Esse caso reflete uma crescente preocupação entre editores e criadores de conteúdo sobre como suas obras estão sendo utilizadas para treinar sistemas de IA, levantando questões sobre a ética e a legalidade desse processo. Para o setor de tecnologia brasileiro, que também está se aventurando no desenvolvimento de soluções de IA, essa situação serve como um alerta sobre a necessidade de respeitar os direitos autorais e de estabelecer práticas transparentes no uso de dados para treinamento de modelos.

Além disso, a alegação de que a OpenAI estaria "canibalizando" o tráfego da web da Britannica ao gerar respostas que competem diretamente com o conteúdo original destaca um ponto crítico: a forma como as IAs estão moldando a dinâmica de consumo de informação. Isso pode levar a uma diminuição do tráfego para sites de conteúdo original, o que, por sua vez, pode afetar a sustentabilidade financeira desses veículos. No Brasil, onde muitos veículos de mídia ainda lutam para se adaptar ao ambiente digital, essa questão é particularmente relevante, pois pode impactar a viabilidade de modelos de negócios baseados em publicidade e assinaturas.

O desfecho desse processo pode estabelecer precedentes importantes para futuras interações entre empresas de IA e criadores de conteúdo. À medida que mais publicações e editoras se manifestam contra o uso não autorizado de seu material, é provável que vejamos um aumento nas ações legais nesse sentido. Para as startups e empresas de tecnologia no Brasil, isso pode significar a necessidade de revisar suas estratégias de coleta e uso de dados, garantindo que estejam em conformidade com as leis de direitos autorais e evitando possíveis litígios. O que se observa é uma mudança no paradigma de como as informações são acessadas e utilizadas, que pode exigir uma reavaliação das práticas atuais no setor.

Por fim, a situação atual também pode estimular um debate mais amplo sobre a regulamentação da IA e a necessidade de um marco legal que proteja tanto os criadores de conteúdo quanto as empresas de tecnologia. À medida que a IA se torna cada vez mais integrada em nossas vidas diárias, a criação de um equilíbrio entre inovação e proteção dos direitos autorais será crucial para o desenvolvimento sustentável do setor de tecnologia, tanto no Brasil quanto globalmente.

O que esta cobertura entrega

  • Atribuicao clara de fonte com link para a publicacao original.
  • Enquadramento editorial sobre relevancia, impacto e proximos desdobramentos.
  • Revisao de legibilidade, contexto e duplicacao antes da publicacao.

Fonte original:

The Verge AI

Sobre este artigo

Este artigo foi curado e publicado pelo AIDaily como parte da nossa cobertura editorial sobre desenvolvimentos em inteligência artificial. O conteúdo é baseado na fonte original citada abaixo, enriquecido com contexto e análise editorial. Ferramentas automatizadas podem auxiliar tradução e estruturação inicial, mas a decisão de publicar, a revisão factual e o enquadramento de contexto seguem responsabilidade editorial.

Saiba mais sobre nosso processo editorial