Posts Recentes:

Emergence acha que pode decifrar o código do agente de IA

Ainda outra IA generativa empreendimento levantou um pacote...

Aquisição Rockset da OpenAI e como isso pode impactar o marketing digital

A OpenAI adquiriu uma tecnologia da Rockset que...

O OpenAI GPT-4o Hype era um troll no Google?


A OpenAI conseguiu roubar a atenção do Google nas semanas que antecederam o maior evento do ano do Google (Google I/O). Quando o grande anúncio chegou lá tudo que eles tinham para mostrar era um modelo de linguagem um pouco melhor que o anterior com a parte “mágica” nem em fase de testes Alpha.

OpenAI pode ter deixado os usuários se sentindo como uma mãe recebendo um aspirador de pó no Dia das Mães, mas certamente conseguiu minimizar a atenção da imprensa para o importante evento do Google.

A Letra O

A primeira dica de que há pelo menos um pouco de trollagem é o nome do novo modelo GPT, 4 “o” com a letra “o” como no nome do evento do Google, I/O.

OpenAI diz que a letra O significa Omni, o que significa tudo, mas com certeza parece que há um subtexto nessa escolha.

GPT-4o vendido como mágica

Sam Altman, em um tweet na sexta-feira anterior ao anúncio, prometeu “coisas novas” que pareciam “mágicas” para ele:

“não é gpt-5, não é um mecanismo de busca, mas temos trabalhado arduamente em algumas coisas novas que achamos que as pessoas vão adorar! parece mágica para mim.

O cofundador da OpenAI, Greg Brockman, tuitou:

“Apresentamos o GPT-4o, nosso novo modelo que pode raciocinar em texto, áudio e vídeo em tempo real.

É extremamente versátil, divertido de brincar e é um passo em direção a uma forma muito mais natural de interação humano-computador (e até mesmo de interação humano-computador-computador):”

O próprio anúncio explicava que as versões anteriores do ChatGPT usavam três modelos para processar a entrada de áudio. Um modelo para transformar entrada de áudio em texto. Outro modelo para completar a tarefa e gerar a versão em texto dela e um terceiro modelo para transformar a saída de texto em áudio. A inovação do GPT-4o é que agora ele pode processar a entrada e saída de áudio dentro de um único modelo e produzir tudo no mesmo tempo que um ser humano leva para ouvir e responder a uma pergunta.

Mas o problema é que a parte de áudio ainda não está online. Eles ainda estão trabalhando para que as proteções funcionem e levará semanas até que uma versão Alpha seja lançada para alguns usuários para teste. Espera-se que as versões Alpha possivelmente tenham bugs, enquanto as versões Beta estão geralmente mais próximas dos produtos finais.

Foi assim que a OpenAI explicou o atraso decepcionante:

“Reconhecemos que as modalidades de áudio do GPT-4o apresentam uma variedade de novos riscos. Hoje estamos divulgando publicamente entradas e saídas de texto e imagem. Nas próximas semanas e meses trabalharemos na infraestrutura técnica, usabilidade via pós-treinamento e segurança necessária para liberação das demais modalidades.

A parte mais importante do GPT-4o, a entrada e saída de áudio, está concluída, mas o nível de segurança ainda não está pronto para divulgação pública.

Alguns usuários decepcionados

É inevitável que um produto incompleto e vendido em excesso gere algum sentimento negativo nas redes sociais.

O engenheiro de IA Maziyar Panahi (perfil do LinkedIn) tuitou sua decepção:

“Tenho testado o novo GPT-4o (Omni) no ChatGPT. Eu não estou impressionado! Nem um pouco! Mais rápido, mais barato, multimodal, isso não é para mim.
Intérprete de código, isso é tudo que me importa e é tão preguiçoso quanto antes!”

Ele seguiu com:

“Entendo que para startups e empresas o áudio mais barato, mais rápido, etc. Mas eu só uso o Chat, e lá é praticamente a mesma coisa. Pelo menos para assistente de Data Analytics.

Além disso, não acredito que receba mais nada pelos meus $ 20. Hoje nao!”

Há outros no Facebook e no X que expressaram sentimentos semelhantes, embora muitos outros tenham ficado satisfeitos com o que consideraram uma melhoria na velocidade e no custo do uso da API.

A OpenAI supervendeu o GPT-4o?

Dado que o GPT-4o está inacabado, é difícil não perder a impressão de que o lançamento foi programado para coincidir e prejudicar o Google I/O. Lançá-lo na véspera do grande dia do Google com um produto incompleto pode ter criado inadvertidamente a impressão de que o GPT-4o no estado atual é uma pequena melhoria iterativa.

No estado atual, não é um avanço revolucionário, mas assim que a parte de áudio do modelo sair do estágio de teste Alpha e passar pelo estágio de teste Beta, poderemos começar a falar sobre revoluções no modelo de linguagem grande. Mas quando isso acontecer, o Google e a Anthropic já podem ter fincado uma bandeira naquela montanha.

O anúncio da OpenAI pinta uma imagem sem brilho do novo modelo, promovendo o desempenho no mesmo nível do GPT-4 Turbo. Os únicos pontos positivos são as melhorias significativas em outros idiomas além do inglês e para usuários de API.

OpenAI explica:

  • “Ele corresponde ao desempenho do GPT-4 Turbo em texto e código em inglês, com melhorias significativas em texto em idiomas diferentes do inglês, ao mesmo tempo que é muito mais rápido e 50% mais barato na API.”

Aqui estão as classificações em seis benchmarks que mostram que o GPT-4o mal superou o GPT-4T na maioria dos testes, mas ficou atrás do GPT-4T em um benchmark importante para compreensão de leitura.

Aqui estão as pontuações:

  • MMLU (Compreensão Massiva de Linguagem Multitarefa)
    Esta é uma referência para precisão multitarefa e resolução de problemas em mais de cinquenta tópicos como matemática, ciências, história e direito. GPT-4o (pontuação 88,7) está ligeiramente à frente do GPT4 Turbo (86,9).
  • GPQA (referência de perguntas e respostas à prova do Google em nível de pós-graduação)
    São 448 questões de múltipla escolha escritas por especialistas humanos em vários campos, como biologia, química e física. GPT-4o pontuou 53,6, superando ligeiramente o GPT-4T (48,0).
  • Matemática
    GPT 4o (76,6) supera GPT-4T em quatro pontos (72,6).
  • Avaliação Humana
    Este é o benchmark de codificação. GPT-4o (90,2) supera ligeiramente o GPT-4T (87,1) em cerca de três pontos.
  • MGSM (referência de matemática para escolas primárias multilíngues)
    Isso testa habilidades matemáticas de nível escolar LLM em dez idiomas diferentes. GPT-4o pontua 90,5 versus 88,5 para GPT-4T.
  • DROP (raciocínio discreto sobre parágrafos)
    Este é um benchmark composto por 96 mil perguntas que testa a compreensão do modelo de linguagem sobre o conteúdo dos parágrafos. GPT-4o (83,4) pontua quase três pontos abaixo do GPT-4T (86,0).

A OpenAI trollou o Google com o GPT-4o?

Dado o modelo provocativamente nomeado com a letra o, é difícil não considerar que a OpenAI está tentando roubar a atenção da mídia antes da importante conferência I/O do Google. Quer essa fosse a intenção ou não, a OpenAI teve grande sucesso em minimizar a atenção dada à próxima conferência de busca do Google.

Será que um modelo de linguagem que mal supera o seu antecessor vale todo o hype e atenção da mídia que recebeu? O anúncio pendente dominou a cobertura noticiosa do grande evento do Google, então para a OpenAI a resposta é claramente sim, valeu a pena o hype.

Imagem em destaque por Shutterstock/BeataGFX

Últimas

Emergence acha que pode decifrar o código do agente de IA

Ainda outra IA generativa empreendimento levantou um pacote...

Aquisição Rockset da OpenAI e como isso pode impactar o marketing digital

A OpenAI adquiriu uma tecnologia da Rockset que...

Interrupções em concessionárias de automóveis se prolongam após ataques cibernéticos de CDK

Fabricante de software CDK diz que levará “vários...

Assine

spot_img

Veja Também

Emergence acha que pode decifrar o código do agente de IA

Ainda outra IA generativa empreendimento levantou um pacote...

Aquisição Rockset da OpenAI e como isso pode impactar o marketing digital

A OpenAI adquiriu uma tecnologia da Rockset que...

Interrupções em concessionárias de automóveis se prolongam após ataques cibernéticos de CDK

Fabricante de software CDK diz que levará “vários...

O Google está trazendo acesso Gemini para adolescentes usando suas contas escolares

Google anunciado na segunda-feira que está trazendo sua...
spot_img

Emergence acha que pode decifrar o código do agente de IA

Ainda outra IA generativa empreendimento levantou um pacote de dinheiro. E, como os outros antes, está prometendo a lua.Emergência, cujos cofundadores incluem...

Aquisição Rockset da OpenAI e como isso pode impactar o marketing digital

A OpenAI adquiriu uma tecnologia da Rockset que permitirá a criação de novos produtos, análise de dados em tempo real e sistemas de...