Posts Recentes:

O novo serviço AWS permite que os clientes aluguem GPUs Nvidia para projetos rápidos de IA


GettyImages 1411834236

Cada vez mais empresas executam grandes modelos de linguagem, que exigem chegada a GPUs. De longe, os mais populares são os da Nvidia, o que os torna caros e muitas vezes escassos. Alugar uma instância de longo prazo de um provedor de nuvem quando você só precisa de chegada a esses recursos caros para um único trabalho não faz necessariamente sentido.

Para ajudar a resolver esse problema, a AWS lançou hoje os blocos de capacidade do Amazon Elastic Compute Cloud (EC2) para ML, permitindo que os clientes comprem chegada a essas GPUs por um período de tempo definido, normalmente para executar qualquer tipo de trabalho relacionado à IA, uma vez que treinar um padrão de tirocínio de máquina ou executando um experimento com um padrão existente.

“Esta é uma maneira inovadora de agendar instâncias de GPU, onde você pode reservar o número de instâncias necessárias para uma data futura, unicamente pelo tempo necessário”, escreveu Channy Yun. em uma postagem de blog anunciando o novo recurso.

O resultado dá aos clientes chegada a instâncias de GPUs Nvidia H100 Tensor Core em tamanhos de cluster de uma a 64 instâncias com 8 GPUs por instância. Eles podem reservar tempo de até 14 dias em incrementos de um dia, com até oito semanas de antecedência. Quando o período terminar, as instâncias serão encerradas maquinalmente.

O novo resultado permite que os usuários se inscrevam no número de instâncias que precisam por um período definido, da mesma forma que reservam um quarto de hotel por um determinado número de dias (uma vez que disse a empresa). Do ponto de vista do cliente, ele saberá exatamente quanto tempo o trabalho será executado, quantas GPUs usará e quanto custará previamente, dando-lhes certeza de custos.

Para a Amazon, eles podem colocar esses recursos sob demanda para funcionar quase em um envolvente de leilão, garantindo-lhes receita (assumindo que os clientes compareçam, é simples). O preço de chegada a estes recursos será verdadeiramente dinâmico, variando em função da oferta e da procura, segundo a empresa.

À medida que os usuários se inscrevem no serviço, ele exibe o dispêndio totalidade do prazo e dos recursos. Os usuários podem aumentar ou diminuir esse valor, dependendo de seu gosto por recursos e orçamentos, antes de concordar em comprar.

O novo recurso está disponível a partir de hoje na região AWS Leste dos EUA (Ohio).

Últimas

YouTube TV lança opção para reduzir atraso de transmissão e evitar spoilers

O YouTube TV está adicionando uma nova opção...

Google apresenta Gemini e atualiza Bard com Gemini Pro

O Google revelou o Gemini, seu modelo de...

Assine

spot_img

Veja Também

YouTube TV lança opção para reduzir atraso de transmissão e evitar spoilers

O YouTube TV está adicionando uma nova opção...

Google apresenta Gemini e atualiza Bard com Gemini Pro

O Google revelou o Gemini, seu modelo de...

Dez principais ferramentas para agências PPC

Ter as ferramentas certas é crucial para as...
spot_img

Google Maps para Android Auto agora permite salvar a localização do estacionamento ao chegar ao destino

O Google Maps para Android Auto está recebendo uma nova funcionalidade útil: a capacidade de salvar a localização do estacionamento ao chegar ao...

Atualização de avaliações do Google de novembro de 2023 concluída após lançamento de 29 dias

A atualização de avaliações do Google de novembro de 2023, a última que o Google confirmará, foi lançada ontem...

YouTube TV lança opção para reduzir atraso de transmissão e evitar spoilers

O YouTube TV está adicionando uma nova opção para reduzir o atraso de transmissão e ajudar os usuários a evitar spoilers.Agora, os...