Posts Recentes:

OpenAI fecha acordo para treinar IA em dados do Reddit


A OpenAI chegou a um acordo com o Reddit para usar os dados do site de notícias sociais para treinar modelos de IA.

Em uma postagem no site de relações com a imprensa da OpenAI, a empresa disse que a parceria com o Reddit fornecerá acesso a “conteúdo estruturado e exclusivo em tempo real” – por exemplo, postagens e respostas – do Reddit, permitindo que suas ferramentas e modelos “entendam melhor e mostrar” esse conteúdo. O conteúdo do Reddit será incorporado ao ChatGPT, a popular IA de conversação da OpenAI, e as empresas trabalharão juntas para trazer novos “recursos alimentados por IA” não especificados para usuários e moderadores do Reddit.

OpenAI também se tornará um parceiro de publicidade do Reddit.

“O Reddit se baseará na plataforma de modelos de IA da OpenAI para dar vida à sua visão poderosa”, escreveu a OpenAI no post. “O uso de LLMs, ML e IA permite que o Reddit melhore a experiência do usuário para todos.”

A OpenAI tem vários acordos de licenciamento semelhantes com provedores de conteúdo, desde bibliotecas de mídia até editores de notícias. Mas o ângulo incomum disso é que Sam Altman, CEO da OpenAI, tem uma participação de 8,7% no Reddit, o que o torna o terceiro maior acionista, e já foi membro do conselho de administração da empresa.

Numa tentativa de desencorajar o escrutínio, a OpenAI afirma no seu comunicado de imprensa que, embora Altman continue a ser acionista do Reddit, a parceria “foi liderada pelo COO da OpenAI”. [Brad Lightcap]” e “aprovado por [OpenAI’s] conselho de administração independente.” (Observarei aqui que o próprio Altman é membro do conselho da OpenAI.)

O Reddit tornou os acordos de licenciamento de dados uma parte cada vez mais central de sua estratégia de crescimento à medida que navega no mercado como uma empresa pública.

Em seu prospecto de IPO, o Reddit revelou que tem acordos contratuais para licenciar seus dados a clientes, incluindo o Google, no valor combinado de mais de US$ 200 milhões. E, no seu primeiro relatório de lucros como empresa pública, o Reddit relatou um aumento de 450% ano após ano nas receitas não publicitárias, atribuível principalmente a esses acordos.

As ações do Reddit subiram 11% nas negociações estendidas após o anúncio do acordo OpenAI.

“O paradoxo que vejo é que, à medida que mais conteúdo na Internet é escrito por máquinas, há uma valorização crescente do conteúdo proveniente de pessoas reais”, disse Steve Huffman, CEO do Reddit, durante a teleconferência de resultados da empresa em março. “E temos quase duas décadas de conversas autênticas.”

A plataforma do Reddit — que tem mais de 1 bilhão de postagens e mais de 16 bilhões de comentários, números que crescem a cada dia graças às suas centenas de milhões de usuários ativos — é uma mina de ouro para empresas de IA generativa, cujos modelos aprendem com exemplos de conteúdo, como texto e imagens, para gerar conteúdo novo e semelhante.

Mas a empresa pode enfrentar resistência de usuários preocupados com a forma como está monetizando seus dados.

É instrutivo dar uma olhada no Stack Overflow, o fórum de perguntas e respostas para desenvolvedores de software, que recentemente assinou um acordo com a OpenAI para fornecer dados para o treinamento do modelo deste último. Em protesto, alguns usuários excluíram as respostas mais bem avaliadas às perguntas da comunidade. Mas o Stack Overflow restaurou as postagens excluídas e baniu esses usuários, alegando que eles não estavam em conformidade com os termos de serviço.

O Reddit já expressou seu descontentamento com uma tentativa de permitir aos usuários do Reddit maior controle sobre seus próprios dados.

Vana, uma startup construída no blockchain, está tentando lançar um “DAO” (Organização Autônoma Digital) de dados para permitir que os usuários do Reddit reúnam seus dados e decidam juntos como esses dados combinados serão usados ​​(ou vendidos). O Reddit baniu o subreddit de Vana dedicado à discussão sobre o DAO, em comunicado ao TechCrunch, e acusou a empresa de “explorar” seus controles de exportação de dados.

Últimas

Assine

spot_img

Veja Também

Snap visualiza seu modelo de imagem em tempo real que pode gerar experiências de AR

Na Augmented World Expo na terça-feira, o Snap...

5 melhores práticas para melhorar seus resultados »Classificar matemática

A otimização da pesquisa por voz emergiu como...

Razorfish R-Index transforma silos de dados do consumidor em insights estratégicos

A Razorfish lançou uma nova tecnologia chamada R-Index...
spot_img

Snap visualiza seu modelo de imagem em tempo real que pode gerar experiências de AR

Na Augmented World Expo na terça-feira, o Snap apresentou uma versão inicial de seu modelo de difusão de imagens em tempo real no...

Como reduzir o desperdício de orçamento publicitário: o custo oculto das variantes aproximadas

Esta postagem foi patrocinada pela Adpulse. As opiniões expressas neste artigo são de responsabilidade do patrocinador. Como gestores de mídia paga, uma pergunta...