A xAI, empresa de Elon Musk, anunciou o lançamento do Grok-1.5, uma versão aprimorada de seu modelo de linguagem grande (LLM) proprietário.
Programado para ser lançado na próxima semana, o Grok-1.5 apresenta melhores capacidades de raciocínio e resolução de problemas, aproximando-se do desempenho de LLMs abertos e fechados conhecidos, como GPT-4 da OpenAI e Claude 3 da Anthropic.
O Grok-1.5 é capaz de processar contextos longos, embora ainda fique atrás da janela de contexto do Gemini 1.5 Pro de até 1 milhão de tokens.
Musk indicou que o Grok-1.5 alimentará o chatbot da xAI que desafiará o ChatGPT na plataforma X, enquanto o Grok-2, sucessor do novo modelo, ainda está em fase de treinamento.
Ele afirmou que a próxima versão deve ser capaz de “superar a IA atual em todas as métricas”, mas não compartilhou detalhes sobre quando ela pode estar disponível.
O Grok-1.5 apresenta melhorias significativas em relação ao modelo anterior em todos os principais benchmarks, incluindo aqueles relacionados a tarefas de codificação e matemática. Em testes, o modelo alcançou uma pontuação de 50,6% no benchmark MATH e 90% no benchmark GSM8K.
Além disso, o Grok-1.5 tem uma janela de contexto de até 128.000 tokens, permitindo que ele processe grandes quantidades de informações de uma só vez. O que o torna mais adequado para analisar, resumir e extrair informações de documentos longos.
No benchmark MMLU, sua pontuação de 81,3% supera o Mistral Large, mas fica atrás do Gemini 1.5 Pro, GPT-4 e Claude 3 Opus. No entanto, no benchmark HumanEval, o Grok-1.5 superou todos os modelos, exceto o Claude 3 Opus.
A xAI planeja iniciar a implantação do Grok-1.5 na próxima semana. O modelo estará inicialmente disponível para testadores iniciais e usuários do chatbot Grok na plataforma X.