D-ID, a startup sediada em Tel Aviv mais conhecida uma vez que tecnologia por trás daqueles vídeos virais de fotos animadas de família, está trazendo sua tecnologia de vídeo AI para um novo aplicativo traste, lançado hoje. Originalmente disponível uma vez que uma plataforma web, os D-IDs Estúdio de Realidade Criativa permite que os usuários carreguem uma imagem estática e um script e depois transformem isso em um vídeo gerado por IA. A tecnologia pode ser usada para produzir representações digitais de si mesmos, de figuras históricas, personagens fictícios, apresentadores ou embaixadores da marca.
Os primeiros casos de uso que a empresa almejava envolviam treinamento e instrução corporativa, informação interna e externa de empresas e marketing e vendas de produtos, TechCrunch relatado anteriormente.
Agora disponível no celular, os usuários farão o download do aplicativo D-ID no Loja de aplicativos ou Google Play e depois crie uma conta ou faça login, se já estiver registrado. Na tela de seleção, você pode escolher uma “pessoa do dedo” pré-fabricada fornecida pelo D-ID ou fazer upload de uma imagem da livraria de fotos do seu telefone. Em seguida, você inserirá o texto que deseja que a pessoa do dedo diga, escolhendo entre 119 idiomas, além de escolher entre opções de voz masculina e feminina. Você também pode escolher o tom do exposição – uma vez que satisfeito, entusiasmado, amigável, esperançoso, noticiário, triste, gritando de terror, hostil, sussurrando e outros.

Créditos da imagem: FEZ
Para funcionar, a D-ID está aproveitando uma combinação de tecnologias de IA proprietárias e de código destapado para fomentar suas plataformas, diz Gil Perry, CEO da D-ID.
“Em sua origem está um padrão fundamental capaz de gerar quadros de vídeo com base na ingressão de áudio. Todos os seus produtos são alimentados por sua API robusta com a capacidade de renderizar vídeo a 100 FPS, líder do setor, quatro vezes mais rápido do que a renderização em tempo real”, diz ele.
“O público principal são os entusiastas da IA, mas é relevante para quem deseja postar vídeos com pessoas digitais, sejam versões de si mesmos ou de qualquer pessoa que possam imaginar – personagens históricos, personagens fictícios, ancestrais, etc.”, diz Perry. “O aplicativo permite a geração de vídeos em qualquer lugar, reduzindo o dispêndio de produção em graduação, e permite flexibilidade para produzir vídeos em qualquer lugar.”

Créditos da imagem: FEZ
Os vídeos podem ter até 10 minutos de duração e estão sujeitos aos mesmos e estão sujeitos aos mesmos moderação políticas uma vez que a versão web – ou seja, a empresa está trabalhando para prometer que a tecnologia não seja usada para deepfakes que propagam desinformação e campanhas de desinformação. A empresa tem também se comprometeu a respeitar os direitos autorais, aderir aos regulamentos de IA e não licenciar conscientemente sua tecnologia ao que labareda de “áreas contenciosas”, incluindo partidos políticos, editores de pornografia, organizações terroristas e armas ou fabricantes de armas.
Antes do lançamento traste, a versão desktop do Creative Reality Studio recebeu 60.000 novas inscrições por dia, com mais de 150 milhões de vídeos já feitos usando a plataforma, disse Perry. Aliás, a API do serviço conta com mais de 200 milénio usuários.
Com sua chegada aos dispositivos móveis, o D-ID é capaz de conseguir um mercado mais extenso, incluindo usuários que priorizam os dispositivos móveis ou somente os dispositivos móveis. Isso inclui tanto usuários existentes que estão interessados em usar uma versão mais enxuta do estúdio para dispositivos móveis, quanto novos usuários do público em universal, incluindo consumidores.
O novo serviço traste será fundamentado em assinatura, com planos a partir de US$ 5,99 por mês. Os usuários já assinantes da versão desktop podem manter seus planos existentes. Um teste gratuito de 14 dias também está disponível.
Embora sediada em Tel Aviv, a D-ID tem funcionários em outros mercados ao volta do trabalho, o que lhe permite continuar as operações durante a guerra Israel-Hamas.
“Nossas equipes em Israel e em todo o mundo estão trabalhando para prometer o mais elevado nível de suporte e serviço”, afirma Perry. “Deve-se notar que a nossa equipa na Ucrânia está a operar com diligência extra, em grande solidariedade com a situação em Israel”, acrescenta.

Créditos da imagem: FEZ
A D-ID arrecadou US$ 25 milhões na Série B no ano pretérito, depois o lançamento de seu projeto Deep Nostalgia e seu spin-off, LiveStory. Esses dois projetos envolveram a animação de fotos históricas de familiares, sendo que o último adicionou áudio. O vídeos se tornaram virais à medida que as pessoas usavam a tecnologia para produzir fotos faladas de entes queridos ou ancestrais há muito perdidos. Desde portanto, o D-ID também tem trabalhado para produzir um interface fotorrealista para ChatGPT muito uma vez que a sua Software Creative Reality Studiouma vez que segmento dos seus esforços mais amplos de desenvolvimento de IA.