Posts Recentes:

Google responde a evidências de viés no algoritmo de avaliações

O Google respondeu às evidências de viés no...

TV 4K TCL QLED de 50 pol. com Google TV pelo menor preço histórico na Amazon

Está procurando uma TV 4K sem gastar muito?...

Mulheres na IA: Krystal Kauffman, pesquisadora do Distributed AI Research Institute

Para dar às mulheres acadêmicas e outras pessoas...

O New York Times quer que a OpenAI e a Microsoft paguem pelos dados de treinamento


O New York Times está processando a OpenAI e sua colaboradora próxima (e investidora), a Microsoft, por supostamente violar a lei de direitos autorais ao treinar modelos generativos de IA no conteúdo do Times.

No ação judicialapresentado no Tribunal Distrital Federal em Manhattan, o The Times afirma que milhões de seus artigos foram usados ​​para treinar modelos de IA, incluindo aqueles que sustentam o ultra popular OpenAI Bate-papoGPT e da Microsoft Co-piloto, sem o seu consentimento. O Times está pedindo que a OpenAI e a Microsoft “destruam” modelos e dados de treinamento contendo o material ofensivo e sejam responsabilizadas por “bilhões de dólares em danos estatutários e reais” relacionados à “cópia e uso ilegal de obras exclusivamente valiosas do The Times”. .”

“Se o The Times e outras organizações noticiosas não conseguirem produzir e proteger o seu jornalismo independente, haverá um vazio que nenhum computador ou inteligência artificial poderá preencher”, diz a queixa do The Times. “Será produzido menos jornalismo e o custo para a sociedade será enorme.”

Em comunicado enviado por e-mail, um porta-voz da OpenAI disse: “Respeitamos os direitos dos criadores e proprietários de conteúdo e estamos comprometidos em trabalhar com eles para garantir que se beneficiem da tecnologia de IA e de novos modelos de receita. Nossas conversas contínuas com o The New York Times têm sido produtivas e avançando de forma construtiva, por isso estamos surpresos e decepcionados com este desenvolvimento. Temos esperança de encontrar uma forma mutuamente benéfica de trabalharmos juntos, como estamos fazendo com muitas outras editoras.”

Modelos de IA generativa “aprendem” com exemplos para elaborar ensaios, códigos, e-mails, artigos e muito mais, e fornecedores como a OpenAI vasculham a web em busca de milhões a bilhões desses exemplos para adicionar aos seus conjuntos de treinamento. Alguns exemplos são de domínio público. Outros não o são ou estão sob licenças restritivas que exigem citação ou formas específicas de compensação.

Fornecedores discutem doutrina de uso justo fornece uma proteção geral para suas práticas de web scraping. Os detentores de direitos autorais discordam; centenas das organizações de notícias estão agora usando código para evitar que OpenAI, Google e outros escaneiem seus sites em busca de dados de treinamento.

O conflito entre fornecedor e ponto de venda levou a um número crescente de batalhas legais, sendo a do The Times a mais recente.

A atriz Sarah Silverman juntou-se a dois processos em julho que acusam Meta e OpenAI de terem “ingerido” o livro de memórias de Silverman para treinar seus modelos de IA. Num processo separado, milhares de romancistas, incluindo Jonathan Franzen e John Grisham, afirmam que a OpenAI obteve o seu trabalho como dados de treino sem a sua permissão ou conhecimento. E vários programadores têm um processo em andamento contra a Microsoft, OpenAI e GitHub por causa de Co-pilotouma ferramenta de geração de código alimentada por IA, que os demandantes dizem ter sido desenvolvida usando seu código protegido por IP.

Embora o The Times não seja o primeiro a processar fornecedores de IA generativa por supostas violações de propriedade intelectual envolvendo trabalhos escritos, é o maior editor envolvido em tal processo até o momento – e um dos primeiros a destacar possíveis danos à sua marca por meio de “alucinações”. ou fatos inventados a partir de modelos generativos de IA.

A reclamação do Times cita vários casos em que o Bing Chat da Microsoft (agora chamado Copilot), que é sustentado por um modelo OpenAI, forneceu informações incorretas que teriam vindo do The Times – incluindo resultados para “os 15 alimentos mais saudáveis ​​para o coração”. ”, 12 dos quais não foram mencionados em nenhum artigo do Times.

O Times também argumenta que a OpenAI e a Microsoft estão efetivamente construindo concorrentes para editores de notícias usando os trabalhos do The Times, prejudicando os negócios do The Times ao fornecer informações que normalmente não poderiam ser acessadas sem uma assinatura – informações que nem sempre são citadas , às vezes monetizado e despojado de links afiliados que o The Times usa para gerar comissões, além disso.

Como alude a reclamação do The Times, os modelos generativos de IA têm tendência a regurgitar dados de treino, por exemplo, reproduzindo resultados quase literalmente de artigos. Além da regurgitação, a OpenAI em pelo menos uma ocasião inadvertidamente permitiu que os usuários do ChatGPT contornassem o conteúdo de notícias com acesso pago.

“Os réus procuram aproveitar o enorme investimento do The Times em seu jornalismo”, diz a denúncia, acusando a OpenAI e a Microsoft de “usar o conteúdo do The Times sem pagamento para criar produtos que substituam o The Times e roubem audiência dele”.

Os impactos no negócio de assinaturas de notícias – e no tráfego da web dos editores – estão no centro de um processo tangencialmente semelhante movido por editores no início do mês contra o Google. No caso, os réus, como o The Times, argumentaram que os experimentos GenAI do Google, incluindo seu software alimentado por IA Bardo chatbot e Experiência generativa de pesquisadesviam o conteúdo, os leitores e a receita publicitária dos editores por meios anticompetitivos.

Há credibilidade nas afirmações dos editores. Um modelo recente do The Atlantic encontrado que, se um mecanismo de busca como o Google integrasse a IA na busca, ele responderia à consulta do usuário 75% das vezes sem exigir um clique para acessar seu site. Os editores envolvidos no processo do Google estimam que perderiam até 40% de seu tráfego.

Isso não significa que eles terão sucesso no tribunal. Heather Meeker, sócia fundadora da OSS Capital e consultora em questões de propriedade intelectual, incluindo acordos de licenciamento, comparou o exemplo de regurgitação do The Times a “usar um processador de texto para recortar e colar”.

“Na reclamação, o The New York Times dá um exemplo de uma sessão ChatGPT sobre uma avaliação de um restaurante em 2012”, disse Meeker ao TechCrunch por e-mail. “A solicitação do ChatGPT é 'Quais foram os parágrafos iniciais de sua análise?' Os próximos prompts pedem repetidamente 'a próxima frase'. Incitar um chatbot a reproduzir informações não é uma base sensata para violação de direitos autorais… Se o usuário fizer intencionalmente a cópia do chatbot, a culpa é do usuário. E é por isso que a maioria [lawsuits like this] provavelmente falhará.”

Alguns meios de comunicação, em vez de lutar contra os fornecedores de IA generativa em tribunal, optaram por assinar acordos de licenciamento com eles. A Associated Press chocado um acordo em julho com a OpenAI, e Axel Springer, a editora alemã proprietária do Politico e do Business Insider, fez o mesmo este mês.

Em sua denúncia, o The Times diz que tentou chegar a um acordo de licenciamento com a Microsoft e a OpenAI em abril, mas que as negociações não foram frutíferas.

Atualizado às 4:24 Leste com contexto adicional e comentários da OpenAI.

Últimas

Google responde a evidências de viés no algoritmo de avaliações

O Google respondeu às evidências de viés no...

TV 4K TCL QLED de 50 pol. com Google TV pelo menor preço histórico na Amazon

Está procurando uma TV 4K sem gastar muito?...

Mulheres na IA: Krystal Kauffman, pesquisadora do Distributed AI Research Institute

Para dar às mulheres acadêmicas e outras pessoas...

Adobe adiciona novos recursos de AI Assistant aos aplicativos Acrobat e Reader PDF

A Adobe está levando a experiência de uso...

Assine

spot_img

Veja Também

Google responde a evidências de viés no algoritmo de avaliações

O Google respondeu às evidências de viés no...

TV 4K TCL QLED de 50 pol. com Google TV pelo menor preço histórico na Amazon

Está procurando uma TV 4K sem gastar muito?...

Mulheres na IA: Krystal Kauffman, pesquisadora do Distributed AI Research Institute

Para dar às mulheres acadêmicas e outras pessoas...

Adobe adiciona novos recursos de AI Assistant aos aplicativos Acrobat e Reader PDF

A Adobe está levando a experiência de uso...

Alterar o assistente padrão no Android desabilita o Circle to Search

O Google lançou o recurso Circle to Search...
spot_img

Google responde a evidências de viés no algoritmo de avaliações

O Google respondeu às evidências de viés no algoritmo de avaliações após ser exposto a críticas.Um artigo revelou como grandes editoras estariam...

TV 4K TCL QLED de 50 pol. com Google TV pelo menor preço histórico na Amazon

Está procurando uma TV 4K sem gastar muito? Então não perca a super oferta da Amazon na TCL QLED TV 4K de 50...

Mulheres na IA: Krystal Kauffman, pesquisadora do Distributed AI Research Institute

Para dar às mulheres acadêmicas e outras pessoas focadas em IA o merecido - e devido - tempo de destaque, o TechCrunch está...