Mistral AI, uma startup em expansão no setor de IA, iniciou a missão de revolucionar a inteligência artificial generativa (IA) com seu primeiro grande modelo de linguagem (LLM), o Mistral 7B.
A empresa espera que o novo modelo de 7 bilhões de parâmetros se torne uma alternativa de código aberto às soluções atuais de IA.
Modelos de instrução Mistral 7B e Mistral 7B
Embora outros tenham estabelecido o padrão da indústria com seus modelos de “caixa preta”, a Mistral AI acredita que uma abordagem de código aberto e voltada para a comunidade pode superá-los.
Fazendo comparações com os movimentos de código aberto em navegadores e sistemas operacionais, Mistral sugere que os modelos apoiados pela comunidade são o futuro.
O lançamento do Mistral 7 B é o primeiro passo significativo da empresa em direção à criação de modelos especializados que competem com soluções de IA maiores e mais estabelecidas.
Os pesos brutos do modelo são distribuídos com Bittorrent e no Hugging Face. Esta documentação detalha o pacote de implantação que permite girar rapidamente uma API de conclusão em qualquer grande provedor de nuvem com GPUs NVIDIA.
Os modelos abertos da Mistral AI visam oferecer adaptabilidade superior, permitindo a personalização para tarefas específicas e necessidades do usuário.
Esta abordagem é considerada vantajosa para empresas que pretendem manter os custos baixos e, ao mesmo tempo, manter o desempenho.
Além disso, a empresa acredita que os modelos de código aberto serão ferramentas críticas no combate aos desafios éticos associados à IA, como a censura e o preconceito.
À medida que os modelos generativos continuam a influenciar a sociedade, a capacidade de auditá-los em busca de falhas e uso indevido torna-se cada vez mais vital.
Como usar o Mistral 7B gratuitamente
Magnet 😕 XT = urn: BTIH: 208B101A0F51514ECF285885A8B0F6FB1A1E4D7D & DN = MISTRAL-7B-V0.1 & TR = UDP%3A%2F%HTTPS: //T.CODTBBBM F%https: // t .co/HAadNvH1t0%3A443%2Fannounce
LIBERAR ab979f50d7d406ab8d0b07d09806c72c
– Mistral AI (@MistralAI) 27 de setembro de 2023
O modelo Mistral 7B está disponível para download, com documentação no GitHub ou através do Hugging Face.
Muito legal de ver @MistralAI lançam seus primeiros modelos incluindo um instru 7B! https://t.co/BgguuZx7nO
-clem 🤗 (@ClementDelangue) 27 de setembro de 2023
Além disso, você pode conversar com o modelo Mistral 7B Instruct no Perplexity Labs.
Mistral AI ganhou manchetes com financiamento inicial
A Mistral AI ganhou as manchetes neste verão, quando levantou US$ 113 milhões em financiamento inicial em junho, sublinhando a confiança dos investidores na abordagem de código aberto.
O financiamento foi liderado pela Lightspeed Venture Partners, com mais de uma dúzia de investidores, incluindo Érico Schmidtex-CEO do Google, que frequentemente discute IA.
Conquista incrível de @InflectionAI – Em menos de um ano, eles desenvolveram um dos LLMs mais sofisticados e lançaram o Pi, o primeiro produto pessoal de IA com alto EQ. https://t.co/kDWLql8nJG
-Eric Schmidt (@ericschmidt) 30 de junho de 2023
A equipe da Mistral AI é composta por cientistas de dados, engenheiros de software e engenheiros de aprendizado de máquina provenientes de DeepMind, Meta, Hugging Face e outros.
Grandes notícias! Estou animado em compartilhar que iniciarei um novo capítulo em minha carreira na @aimistral. Estou extremamente grato pelo crescimento e pelas memórias que criei durante meu tempo na @huggingface. Estou ansioso para trazer minhas habilidades e paixão para minha nova função. 🚀 🚀 🚀
-Saulnier Lucile (@LucileSaulnier) 18 de julho de 2023
Arthur Mensch, cofundador e CEO da Mistral AI, expressou entusiasmo sobre o que a empresa planejava alcançar:
“A nossa formação como investigadores de IA, combinada com as nossas respectivas experiências profissionais nas principais empresas tecnológicas do mundo, convenceu-nos de que existe um caminho a seguir para um projecto alternativo e inovador que nos permitirá disseminar de forma responsável a tecnologia mais promissora da nossa geração como o mais amplamente possível.
Estamos orgulhosos de iniciar este projeto global a partir de França, o nosso país de origem, e de contribuir, ao nosso nível, para o surgimento de um novo ator credível na inteligência artificial generativa da Europa. Nos próximos meses, concentraremos toda a nossa energia e paixão em honrar a confiança depositada em nós pelos nossos investidores.”
De acordo com a apresentação, os planos da Mistral incluem o desenvolvimento de modelos de IA superiores aos do OpenAI em 2024.
Nessa rodada (3º trimestre de 2024), esperamos precisar arrecadar 200 milhões, a fim de treinar modelos que excedam as capacidades do GPT-4. Um forte financiamento permitir-nos-á treinar modelos em infra-estruturas maiores, estabelecendo-nos assim como um líder de investigação em IA que será o fornecedor de referência da indústria europeia.
A Mistral AI espera lançar progressivamente novos modelos que preencham a lacuna de desempenho entre suas soluções de código aberto e ofertas proprietárias como parte de sua estratégia contínua.
A França está posicionada como o próximo líder no desenvolvimento de IA?
Em junho, o presidente francês Emmanuel Macron, um grande promotor de startups tecnológicas francesas, esteve na VivaTech, a maior feira europeia de tecnologia de Paris.
Ele queria apoiar startups francesas, ajudá-las a expandir-se internacionalmente e atrair mais investimentos em pesquisas e projetos de IA na França.
Especialistas em tecnologia também observado que a maioria dos desenvolvedores (11 de 14) da tecnologia Llama de código aberto da Meta AI são franceses, o que torna os desenvolvimentos mais recentes em IA não surpreendentes.
Hoje lançamos o LLaMA, 4 modelos de fundação que variam de parâmetros 7B a 65B.
LLaMA-13B supera OPT e GPT-3 175B na maioria dos benchmarks. LLaMA-65B é competitivo com Chinchilla 70B e PaLM 540B.
Os pesos para todos os modelos estão abertos e disponíveis em https://t.co/q51f2oPZlE
1/n pic.twitter.com/DPyJFBfWEq– Guillaume Lample (@GuillaumeLample) 24 de fevereiro de 2023
O futuro da IA de código aberto
Um concorrente potencialmente robusto e de código aberto para LLMs existentes, como o Mistral 7B, poderia oferecer novas oportunidades para as empresas utilizarem IA, com possibilidades de personalização mais amplas e maior controle sobre a segurança dos dados.
A mudança para modelos generativos de código aberto representa uma mudança significativa na indústria de IA, desafiando os modelos proprietários tradicionais por motivos éticos e de desempenho.
Imagem em destaque: The Hornbills Studio/Shutterstock