Posts Recentes:

Threads finalmente lança sua API para desenvolvedores

Meta disse hoje que finalmente lançou sua tão...

Assista e chore (ou sorria): os avatares de vídeo de IA da Synthesia agora apresentam emoções


A IA generativa capturou a imaginação do público com um salto na criação de textos e imagens elaborados e plausivelmente reais a partir de instruções verbais. Mas o problema – e muitas vezes há um problema – é que os resultados muitas vezes estão longe de ser perfeitos quando você olha um pouco mais de perto.

As pessoas apontam dedos estranhos, ladrilhos escapar, e problemas de matemática são precisamente isso: problemáticamente, às vezes não batem certo.

Agora, a Synthesia – uma das ambiciosas startups de IA que trabalha com vídeo, especificamente avatares personalizados projetados para usuários corporativos criarem conteúdo promocional, de treinamento e outros conteúdos de vídeo corporativo – está lançando uma atualização que espera ajudá-la a superar alguns dos desafios em seu campo específico. Sua versão mais recente traz avatares – construídos com base em humanos reais capturados em seu estúdio – que proporcionam mais emoção, melhor rastreamento labial e o que diz serem movimentos naturais e humanos mais expressivos quando são alimentados com texto para gerar vídeos.

O lançamento vem na esteira de alguns progressos impressionantes para a empresa até o momento. Ao contrário de outros players de IA generativa como a OpenAI, que construiu uma estratégia dupla – aumentando a conscientização pública com ferramentas de consumo como ChatGPT e ao mesmo tempo construindo uma oferta B2B, com suas APIs usadas por desenvolvedores independentes, bem como por empresas gigantes – a Synthesia está inclinada na abordagem que algumas outras startups proeminentes de IA estão adotando.

Semelhante ao foco da Perplexity em realmente acertar na pesquisa generativa de IA, Synthesia está focado em realmente acertar como construir os avatares de vídeo generativos mais humanos possíveis. Mais especificamente, está procurando fazer isso apenas para o mercado empresarial e casos de uso como treinamento e marketing.

Esse foco ajudou a Synthesia a se destacar no que se tornou um mercado muito concorrido em IA, que corre o risco de se tornar uma commodity quando o hype se transforma em preocupações de mais longo prazo, como ARR, economia unitária e custos operacionais associados às implementações de IA.

Synthesia descreve seus novos Avatares Expressivos, a versão lançada hoje, como a primeira de seu tipo: “Os primeiros avatares do mundo totalmente gerados com IA”. Construída com base em modelos grandes e pré-treinados, a Synthesia diz que o seu avanço reside na forma como são combinados para obter distribuições multimodais que imitam mais de perto a forma como os humanos reais falam.

Eles são gerados instantaneamente, diz Synthesia, o que pretende estar mais próximo da experiência que passamos quando falamos ou reagimos na vida, e contrasta com a forma como muitas ferramentas de vídeo de IA baseadas em avatares funcionam hoje: normalmente estes na verdade, são muitos pedaços de vídeo que são rapidamente costurados para criar respostas faciais que se alinham, mais ou menos, com os scripts que são inseridos neles. O objetivo é parecer menos robótico e mais realista.

Versão anterior:

Nova versão:

Como você pode ver nos dois exemplos aqui, um da versão mais antiga do Synthesia e o que está sendo lançado hoje, ainda há um longo caminho a percorrer em desenvolvimento, algo que o próprio CEO Victor Riparbelli também admite.

“É claro que ainda não está 100%, mas estará muito, muito em breve, no final do ano. Será tão alucinante”, disse ele ao TechCrunch. “Acho que você também pode ver que a parte da IA ​​nisso é muito sutil. Nos humanos, há muita informação nos mínimos detalhes, nos mínimos movimentos de nossos músculos faciais. Acho que nunca poderíamos sentar e descrever, 'sim, você sorri assim quando está feliz, mas isso é falso, certo?' Isso é algo tão complexo de descrever para os humanos, mas pode ser [captured in] redes de aprendizagem profunda. Na verdade, eles são capazes de descobrir o padrão e depois replicá-lo de maneira previsível.” A próxima coisa em que está trabalhando, acrescentou ele, são as mãos.

“As mãos são super duras”, acrescentou.

O foco no B2B também ajuda a Synthesia a ancorar suas mensagens e produtos mais no uso “seguro” de IA. Isso é essencial, especialmente tendo em conta a enorme preocupação atual com os deepfakes e com o uso da IA ​​para fins maliciosos, como desinformação e fraude. Mesmo assim, Synthesia não conseguiu evitar completamente a controvérsia nessa frente. Como apontamos antes, a tecnologia da Synthesia já foi mal utilizado produzir propaganda na Venezuela e falso reportagens promovidas por contas de mídia social pró-China.

A empresa observou hoje que tomou novas medidas para tentar bloquear esse uso. Mês passadoatualizou suas políticas, disse, “para restringir o tipo de conteúdo que as pessoas podem criar, investindo na detecção precoce de atores de má-fé, aumentando as equipes que trabalham na segurança da IA ​​​​e experimentando tecnologias de credenciais de conteúdo como C2PA”.

Apesar desses desafios, a empresa continuou a crescer.

A síntese foi a última avaliado em US$ 1 bilhão quando arrecadou US$ 90 milhões. Notavelmente, essa arrecadação de fundos ocorreu há quase um ano, em junho de 2023.

Riparbelli (foto acima, à direita, com outros cofundadores Steffen Tjerrild, Professor Lourdes Agapito, Professor Matthias Niessner) disse em uma entrevista no início deste mês que atualmente não há planos para arrecadar mais, embora isso realmente não responda à questão de se Synthesia está sendo abordada de forma proativa. (Nota: estamos muito entusiasmados por ter a verdadeira Riparbelli humana falando em um evento nosso em Londres em maio, onde definitivamente vou perguntar sobre isso novamente. Por favor, venha se você estiver na cidade.)

O que sabemos com certeza é que a IA custa muito dinheiro para construir e operar, e o Synthesia tem construído e executado muito.

Antes do lançamento da versão de hoje, cerca de 200 mil pessoas criaram mais de 18 milhões de apresentações de vídeo em cerca de 130 idiomas usando os 225 avatares legados da Synthesia, disse a empresa. (Não é divulgado quantos usuários estão em seus níveis pagos, mas há muitos clientes de renome, incluindo Zoom, BBC, DuPont e outros, e as empresas pagam.) A esperança da startup, é claro, é que com a nova versão sendo lançada hoje, esses números aumentarão ainda mais.

Últimas

Threads finalmente lança sua API para desenvolvedores

Meta disse hoje que finalmente lançou sua tão...

CuspAI levanta US$ 30 milhões para criar um mecanismo de busca baseado em Gen-AI para novos materiais

O método moderno de criar novos materiais é...

Finbourne investe US$ 70 milhões em tecnologia que transforma poeira de dados financeiros em ouro de IA

As empresas em áreas como os serviços financeiros...

TechCrunch Space: uma nova era para pesquisas de voos espaciais humanos

Olá e bem-vindo de volta ao TechCrunch Space....

Assine

spot_img

Veja Também

Threads finalmente lança sua API para desenvolvedores

Meta disse hoje que finalmente lançou sua tão...

CuspAI levanta US$ 30 milhões para criar um mecanismo de busca baseado em Gen-AI para novos materiais

O método moderno de criar novos materiais é...

Finbourne investe US$ 70 milhões em tecnologia que transforma poeira de dados financeiros em ouro de IA

As empresas em áreas como os serviços financeiros...

TechCrunch Space: uma nova era para pesquisas de voos espaciais humanos

Olá e bem-vindo de volta ao TechCrunch Space....

YouTube testa anotações de crowdsourcing para vídeos

O YouTube está testando um novo recurso experimental...
spot_img

Threads finalmente lança sua API para desenvolvedores

Meta disse hoje que finalmente lançou sua tão aguardada API para Threads para que os desenvolvedores possam construir experiências em torno dela. ...

CuspAI levanta US$ 30 milhões para criar um mecanismo de busca baseado em Gen-AI para novos materiais

O método moderno de criar novos materiais é fazer algo e depois usar um computador para descobrir se o material saiu corretamente. ...

Finbourne investe US$ 70 milhões em tecnologia que transforma poeira de dados financeiros em ouro de IA

As empresas em áreas como os serviços financeiros e os seguros vivem e morrem pelos seus dados – especificamente, até que ponto podem...