Amazon quer hospedar modelos de IA generativos personalizados das empresas

AWS, o negócio de computação em nuvem da Amazon, quer se tornar o empresas locais hospedam e ajustam seus modelos de IA generativos personalizados.

Hoje, a AWS anunciou o lançamento do Custom Model Import (em versão prévia), um novo recurso do Bedrock, o conjunto de serviços generativos de IA da AWS com foco empresarial. O recurso permite que as organizações importem e acessem seus modelos internos de IA generativa como APIs totalmente gerenciadas.

Os modelos proprietários das empresas, uma vez importados, beneficiam-se da mesma infra-estrutura que outros modelos generativos de IA na biblioteca da Bedrock (por exemplo, Llama 3 da Meta ou Claude 3 da Anthropic). Eles também obterão ferramentas para expandir seus conhecimentos, aprimorá-los e implementar salvaguardas para mitigar seus preconceitos.

“Há clientes da AWS que estão ajustando ou construindo seus próprios modelos fora do Bedrock usando outras ferramentas”, disse Vasi Philomin, vice-presidente de IA generativa da AWS, ao TechCrunch em uma entrevista. “Esse recurso de importação de modelo personalizado permite que eles tragam seus próprios modelos proprietários para o Bedrock e os vejam ao lado de todos os outros modelos que já estão no Bedrock – e os usem com todos os fluxos de trabalho que também já estão no Bedrock. .”

Importando modelos personalizados

De acordo com um enquete recente pela Cnvrg, subsidiária da Intel focada em IA, a maioria das empresas está abordando a IA generativa construindo seus próprios modelos e refinando-os para suas aplicações. As empresas dizem que veem a infraestrutura, incluindo a infraestrutura de computação em nuvem, como sua maior barreira à implantação, de acordo com a pesquisa.

Com a importação de modelo personalizado, a AWS pretende atender a essa necessidade e, ao mesmo tempo, acompanhar o ritmo dos rivais da nuvem. (CEO da Amazon, Andy Jassy prenunciado tanto em sua recente carta anual aos acionistas.)

Por algum tempo, o Vertex AI, análogo do Google ao Bedrock, permitiu que os clientes carregassem modelos generativos de IA, adaptassem-nos e servi-los por meio de APIs. O Databricks também fornece há muito tempo conjuntos de ferramentas para hospedar e ajustar modelos personalizados, incluindo seu próprio lançado recentemente DBRX.

Questionado sobre o que diferencia o Custom Model Import, Philomin afirmou que ele – e por extensão o Bedrock – oferece uma maior amplitude e profundidade de opções de personalização de modelos do que a concorrência, acrescentando que “dezenas de milhares” de clientes hoje estão usando o Bedrock.

“Número um, a Bedrock oferece várias maneiras para os clientes lidarem com modelos de atendimento”, disse Philomin. “Número dois, temos vários fluxos de trabalho em torno desses modelos – e agora lata dos clientes fique ao lado de todos os outros modelos que já temos disponíveis. Uma coisa importante que a maioria das pessoas gosta é a capacidade de experimentar vários modelos diferentes usando os mesmos fluxos de trabalho e, em seguida, levá-los para produção no mesmo local.”

Então, quais são as opções de personalização do modelo mencionadas?

Philomin aponta para o Guardrails, que permite aos usuários do Bedrock configurar limites para filtrar – ou pelo menos tentar filtrar – os resultados dos modelos para coisas como discurso de ódio, violência e informações pessoais ou corporativas privadas. (Os modelos de IA generativa são notórios por indo fora dos trilhos em maneiras problemáticas, incluindo vazamento de informações confidenciais; Os modelos da AWS foram sem exceção.) Ele também destacou a Avaliação de Modelo, uma ferramenta Bedrock que os clientes podem usar para testar o desempenho de um modelo – ou vários – em um determinado conjunto de critérios.

Tanto Guardrails quanto Model Evaluation estão agora disponíveis após uma prévia de vários meses.

Sinto-me compelido a observar aqui que a importação de modelo personalizado suporta apenas três arquiteturas de modelo no momento: os modelos Flan-T5 do Hugging Face, Llama do Meta e Mistral. Além disso, o Vertex AI e outros serviços rivais da Bedrock, incluindo as ferramentas de desenvolvimento de IA da Microsoft no Azure, oferecem recursos de segurança e avaliação mais ou menos comparáveis (consulte Segurança de conteúdo de IA do Azure, avaliação de modelo em Vertexetc.).

O que é Porém, exclusiva da Bedrock é a família Titan de modelos generativos de IA da AWS. E, coincidindo com o lançamento do Custom Model Import, houve vários desenvolvimentos dignos de nota nessa frente.

Modelos Titan atualizados

Gerador de imagem Titã, o modelo de texto para imagem da AWS, agora está disponível após o lançamento em versão prévia em novembro passado. Como antes, o Titan Image Generator pode criar novas imagens a partir de uma descrição de texto ou personalizar imagens existentes – por exemplo, trocando o fundo de uma imagem enquanto mantém os assuntos na imagem.

Comparado à versão prévia, o Titan Image Generator em GA pode gerar imagens com mais “criatividade”, disse Philomin sem entrar em detalhes. (Seu palpite sobre o que isso significa é tão bom quanto o meu.)

Perguntei a Philomin se ele tinha mais detalhes para compartilhar sobre como o Titan Image Generator foi treinado.

Na estreia do modelo em novembro passado, a AWS foi vaga sobre quais dados exatamente ele usou no treinamento do Titan Image Generator. Poucos fornecedores revelam prontamente tais informações; eles veem os dados de treinamento como uma vantagem competitiva e, portanto, mantêm-nos e as informações relacionadas a eles sob controle.

Os detalhes dos dados de treinamento também são uma fonte potencial de ações judiciais relacionadas à PI, outro desincentivo para revelar muita coisa. Vários casos que tramitam nos tribunais rejeitam as defesas de uso justo dos fornecedores, argumentando que as ferramentas de texto para imagem reproduzem os estilos dos artistas sem a permissão explícita dos artistas e permitem que os usuários gerem novos trabalhos semelhantes aos originais dos artistas, pelos quais os artistas não recebem pagamento.

Philomin apenas me disse que a AWS usa uma combinação de dados próprios e licenciados.

“Temos uma combinação de fontes de dados proprietárias, mas também licenciamos muitos dados”, disse ele. “Na verdade, pagamos taxas de licenciamento aos proprietários de direitos autorais para podermos usar seus dados e temos contratos com vários deles.”

São mais detalhes do que obtivemos em novembro. Mas tenho a sensação de que a resposta de Philomin não irá satisfazer a todos, especialmente os criadores de conteúdo e especialistas em ética de IA que defendem maior transparência em torno do treinamento de modelos de IA generativos.

Em vez de transparência, a AWS afirma que continuará a oferecer um política de indenização que cobre os clientes no caso de um modelo Titan como o Titan Image Generator regurgitar (ou seja, cuspir uma cópia espelhada de) um exemplo de treinamento potencialmente protegido por direitos autorais. (Vários rivais, incluindo a Microsoft e o Google, oferecem políticas semelhantes que abrangem os seus modelos de geração de imagens.)

Para enfrentar outra ameaça ética urgente – deepfakes – a AWS afirma que as imagens criadas com o Titan Image Generator virão, como durante a visualização, com uma marca d’água invisível “à prova de adulteração”. Philomin diz que a marca d'água se tornou mais resistente na versão GA à compactação e outras edições e manipulações de imagens.

Seguindo para um território menos controverso, perguntei a Philomin se a AWS, assim como o Google, OpenAI e outros, está explorando a geração de vídeo, dado o entusiasmo (e o investimento) em torno da tecnologia. Philomin não disse que AWS não foi … mas ele não sugeriria nada mais do que isso.

“Obviamente, estamos constantemente procurando ver quais novos recursos os clientes desejam ter, e a geração de vídeo definitivamente surge nas conversas com os clientes”, disse Philomin. “Eu peço que você fique atento.”

Em uma última notícia relacionada ao Titan, a AWS lançou a segunda geração de seu modelo Titan Embeddings, Titan Text Embeddings V2. Este modelo converte texto em representações numéricas, chamadas de embeddings, para potencializar aplicativos de pesquisa e personalização. O modelo Embeddings de primeira geração também fez isso, mas a AWS afirma que Titan Text Embeddings V2 é, em geral, mais eficiente, econômico e preciso.

“O que o modelo Embeddings V2 faz é reduzir o armazenamento geral [necessary to use the model] em até quatro vezes, mantendo 97% da precisão”, afirmou Philomin, “superando outros modelos comparáveis”.

Veremos se os testes do mundo real confirmam isso.

Adicione o SEO Fórum ao seu feed do Google Notícias.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

SEO Fórum

Conteúdo

Redes Sociais

Posts Recentes:

Mulheres na IA: Catherine Breslin ajuda empresas a desenvolver estratégias de IA

Jack Dorsey diz que não está mais no conselho da Bluesky

Por que a NASA está apostando em uma câmera de 36 pixels

SEO Fórum

Conteúdo

Redes Sociais

Amazon quer hospedar modelos de IA generativos personalizados das empresas

Importando modelos personalizados

Modelos Titan atualizados

Últimas

Mulheres na IA: Catherine Breslin ajuda empresas a desenvolver estratégias de IA

Jack Dorsey diz que não está mais no conselho da Bluesky

Por que a NASA está apostando em uma câmera de 36 pixels

Nuvens alternativas estão crescendo à medida que as empresas buscam acesso mais barato às GPUs

Assine

Veja Também

Mulheres na IA: Catherine Breslin ajuda empresas a desenvolver estratégias de IA

Jack Dorsey diz que não está mais no conselho da Bluesky

Por que a NASA está apostando em uma câmera de 36 pixels

Nuvens alternativas estão crescendo à medida que as empresas buscam acesso mais barato às GPUs

SoundCloud assume o recurso Discover Weekly do Spotify com novas ‘Buzzing Playlists’

Mulheres na IA: Catherine Breslin ajuda empresas a desenvolver estratégias de IA

Jack Dorsey diz que não está mais no conselho da Bluesky

Por que a NASA está apostando em uma câmera de 36 pixels

Institucional

Mais Recentes

Mulheres na IA: Catherine Breslin ajuda empresas a desenvolver estratégias de IA

Jack Dorsey diz que não está mais no conselho da Bluesky

Por que a NASA está apostando em uma câmera de 36 pixels

Nuvens alternativas estão crescendo à medida que as empresas buscam acesso mais barato às GPUs

Mais Populares

6 razões pelas quais seus relatórios do GA4 não estão somando

Como Adicionar Imagens Facilmente no WordPress

Microsoft relança pubCenter

Este ex-futuro unicórnio será vendido por peças?

Assine