Segundo informações do The Telegraph, a OpenAI, empresa responsável pelo desenvolvimento do ChatGPT, declarou recentemente que é impossível treinar inteligência artificial (IA) sem utilizar materiais protegidos por direitos autorais.
Essa afirmação foi feita em resposta a uma investigação realizada pela comissão de comunicações e seleção digital da Câmara dos Lordes do Reino Unido, que está analisando os modelos de linguagem de grande porte.
Os modelos de IA, como o ChatGPT e o DALL-E, obtêm suas habilidades através de sessões de treinamento que incluem o uso de conteúdo coletado da internet, mesmo sem a permissão dos detentores dos direitos autorais (embora a OpenAI também utilize conteúdo licenciado).
Essa prática de coleta de dados é comum na pesquisa acadêmica em aprendizado de máquina, mas está sendo alvo de um escrutínio mais intenso devido à comercialização desses modelos de IA baseados em deep learning.
A OpenAI argumenta que, dada a abrangência dos direitos autorais atualmente, incluindo diversos tipos de expressão humana, como postagens em blogs, fotografias, trechos de código de software e documentos governamentais, torna-se impossível treinar os modelos de IA mais avançados sem utilizar materiais protegidos por direitos autorais.
Essa afirmação da OpenAI surge após um processo movido pelo The New York Times contra a própria OpenAI e a Microsoft, alegando uso indevido de seu conteúdo nos produtos das empresas.
Em resposta ao processo, a OpenAI defendeu-se, apoiando-se no princípio legal do uso justo, que permite o uso limitado de conteúdo protegido por direitos autorais em certas circunstâncias.
A OpenAI destaca que o treinamento de IA utilizando materiais disponíveis publicamente na internet é considerado uso justo, com base em precedentes estabelecidos e amplamente aceitos.
A empresa enfatiza que esse princípio é justo para os criadores, essencial para os inovadores e crucial para a competitividade dos Estados Unidos.