Por muito tempo, os bancos de dados vetoriais foram um produto de nicho, mas como são especialmente adequados para fornecer contexto e memória de longo prazo para grandes modelos de linguagem, todos no espaço de banco de dados agora estão aparentemente tentando inserir a pesquisa vetorial em seus sistemas existentes. produtos o mais rápido possível. Enquanto isso, serviços dedicados como Pinhaque foi fundada pela equipe por trás do Amazon SageMaker, está liderando o processo, com Pinecone arrecadando um total de US$ 138 milhões desde sua fundação em 2019. Hoje, a Pinecone está lançando o Pinecone Serverless, uma arquitetura sem servidor nova e significativamente aprimorada para potencializar seu serviço.
O Pinecone Serverless agora separa leituras, gravações e armazenamento, o que deve reduzir custos para os usuários. Na verdade, a Pinecone argumenta que a sua nova arquitetura pode oferecer uma redução de custos de 10 a 100 vezes. A nova arquitetura agora oferece suporte ao clustering de vetores sobre o armazenamento de blobs. Isso resulta em latências mais baixas e na capacidade do Pinecone Serverless de suportar tamanhos massivos de dados. Da mesma forma, o Pinecone Serverless introduz novos algoritmos de indexação e recuperação para permitir a pesquisa rápida de vetores neste armazenamento de blob. O serviço agora também oferece uma camada de computação multilocatário.
“Por ser verdadeiramente sem servidor, elimina completamente a necessidade dos desenvolvedores provisionarem ou gerenciarem infraestrutura e permite que eles criem aplicativos GenAI com mais facilidade e os coloquem no mercado com muito mais rapidez”, explica a empresa em seu anúncio. “Como resultado, os desenvolvedores com casos de uso de qualquer tamanho podem construir aplicativos GenAI mais confiáveis, eficazes e impactantes com qualquer LLM de sua escolha, levando a uma onda iminente de aplicativos GenAI incríveis chegando ao mercado.”
Desde o início, o Pinecone Serverless oferecerá integrações com vários outros serviços de IA e backend, incluindo Anthropic, Anyscale, Cohere, Confluent, Langchain, Pulumi e Vercel. “A missão da Vercel é ajudar o mundo a fornecer os melhores produtos e, na era da GenAI, isso exige o Pinecone como componente do banco de dados vetorial”, disse Guillermo Rauch, CEO e fundador da Vercel. “É por isso que estamos anunciando que todos os usuários do Vercel agora podem adicionar o Pinecone Serverless aos seus aplicativos com apenas alguns cliques, com recursos mais interessantes por vir.”