Posts Recentes:

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta...

Discord se tornou um centro improvável para o boom generativo da IA


No vídeo, uma multidão ruge em um festival de música de verão lotado. Quando uma batida começa a tocar nos alto-falantes, o artista finalmente entra no palco: é o Coringa. Vestido com seu terno vermelho, cabelo verde e pintura facial característica, o Coringa levanta o punho e dança pelo palco, saltando pela passarela para se aproximar ainda mais de seu mar de fãs. Na hora de começar a fazer rap, o Coringa flexiona os joelhos e se impulsiona do chão, saltando para cima e para baixo antes de dar uma volta de 360º com um pé só. Parece fácil, mas se você tentasse a manobra, cairia de cara no chão. O Coringa nunca foi tão legal.

Depois, há outro vídeo, onde o NBA All-Star Joel Embiid sai dos bastidores para cumprimentar a multidão antes de acertar os mesmos passos de dança. Depois, é a estrela de “Curb Your Enthusiasm”, Larry David. Mas em cada uma dessas cenas, algo está um pouco estranho – seja o Coringa, Joel Embiid ou Larry David, o corpo do artista está trêmulo, enquanto suas expressões faciais nunca mudam.

Claro, tudo isso é gerado por IA, graças a uma empresa chamada Viggle.

O vídeo original mostra o rapper Lil Yachty subindo ao palco do Summer Smash Festival em 2021 – de acordo com o título de um vídeo do YouTube com mais de 6,5 milhões de visualizações, esta entrada é “a saída MAIS DIFÍCIL DE SEMPRE”. Isso se tornou um formato de meme popular em abril, quando as pessoas inseriram suas celebridades favoritas – ou seus vilões favoritos, como Sam Bankman-Fried – no vídeo de Lil Yachty subindo ao palco.

twitter wp-block-embed-twitter"/>

As ofertas de IA de texto para vídeo estão ficando assustadoramente boas, mas você não pode digitar “sam banqueiro frito como lil iate no sucesso do verão de 2021” e esperar que Sora saiba exatamente o que você quer dizer. Viggle funciona de maneira diferente.

No servidor Discord do Viggle, os usuários enviam um vídeo de alguém fazendo algum tipo de movimento – geralmente uma dança TikTok – e a foto de uma pessoa. Em seguida, Viggle cria um vídeo dessa pessoa replicando os movimentos do vídeo. É óbvio que esses vídeos não são reais, embora ainda sejam divertidos. Mas depois que o meme de Lil Yachty se tornou viral, Viggle esquentou e o hype não diminuiu.

“Estamos nos concentrando na construção do que chamamos de modelo de geração de vídeo controlável”, disse o fundador da Viggle, Hang Chu, ao TechCrunch. “Quando geramos conteúdo, queremos controlar com precisão como o personagem se move ou como fica a cena. Mas as ferramentas atuais focam apenas no lado do texto para vídeo, onde o texto em si não é suficiente para especificar toda a sutileza visual.”

Segundo Chu, o Viggle tem dois tipos principais de usuários – enquanto algumas pessoas fazem memes, outras usam o produto como ferramenta no processo de produção para design de jogos e efeitos visuais.

“Por exemplo, uma equipe de engenheiros de animação poderia pegar alguns projetos conceituais e transformá-los rapidamente em recursos de animação simples, mas rápidos”, disse Chu. “O objetivo é ver como eles se parecem no esboço do plano final. Isso geralmente leva dias ou até semanas para que eles sejam configurados manualmente, mas com o Viggle isso pode ser feito basicamente de forma instantânea e automática. Isso economiza toneladas de trabalho de modelagem tedioso e repetitivo.”

Em março, o Discord do Viggle tinha alguns milhares de membros. Em meados de maio, havia 1,8 milhão de membros e, a poucos dias de junho, o servidor do Viggle subiu para mais de 3 milhões de membros. Isso o torna maior do que os servidores de jogos como Valorant e Genshin Impact combinados.

O crescimento do Viggle não mostra sinais de desaceleração, exceto que a alta demanda por geração de vídeo tornou os tempos de espera um pouco longos para usuários impacientes. Mas como o Viggle é tão centrado no Discord, a equipe de desenvolvedores do Discord trabalhou diretamente com o Viggle para orientar a startup de dois anos em seu rápido crescimento.

Felizmente para Viggle, o Discord já passou por isso antes. MidJourney, que também opera no Discord, tem 20,3 milhões de membros em seu servidor, o que a torna a maior comunidade individual da plataforma. No geral, o Discord tem cerca de 200 milhões de usuários mensais.

Viggle Discord2
Créditos da imagem: Vigília/Discórdia

“Ninguém está pronto para esse tipo de crescimento, então, nesse estágio de viralidade, começamos a trabalhar com eles, porque eles não estão prontos”, disse o vice-presidente de produto da Discord, Ben Shanken, ao TechCrunch. “Temos que estar prontos, porque uma grande parte das mensagens enviadas agora são Viggle e MidJourney, e muito consumo e uso no Discord é, na verdade, IA generativa.”

Para startups como Viggle e MidJourney, construir seus aplicativos no Discord significa que eles não precisam construir uma plataforma inteira para seus usuários – em vez disso, eles estão hospedados em uma plataforma que já possui um público experiente em tecnologia, bem como ferramentas integradas de moderação de conteúdo. Para a Viggle, que conta com apenas quinze funcionários, o apoio do Discord é fundamental.

“Podemos nos concentrar na construção do modelo como serviço de back-end, enquanto o Discord pode utilizar sua infraestrutura no front-end e basicamente podemos iterar mais rápido”, disse Chu.

Antes do Viggle, Chu era pesquisador de IA na Autodesk, uma gigante de ferramentas 3D. Ele também fez pesquisas para empresas como Facebook, Nvidia e Google.

Para a Discord, atuar como uma empresa SaaS acidental para startups de IA pode ter um custo. Por um lado, esses aplicativos trazem um novo público para o Discord e provavelmente são bons para as métricas do usuário. Mas hospedar tantos vídeos pode ser difícil e caro do lado tecnológico, especialmente quando outros usuários da plataforma estão transmitindo videogames ao vivo, conversando por vídeo e fazendo chamadas de voz. Sem uma plataforma como o Discord, porém, essas startups podem não conseguir crescer na mesma proporção.

“Não é fácil escalar qualquer tipo de empresa, mas o Discord foi desenvolvido para esse tipo de escala e podemos ajudá-los a absorver isso muito bem”, disse Shanken.

Embora essas empresas possam simplesmente adotar as diretrizes de conteúdo do próprio Discord e usar seus aplicativos de moderação de conteúdo, sempre será um desafio garantir que 3 milhões de pessoas estejam se comportando bem. Mesmo os memes de Lil Yachty violam tecnicamente as regras do Viggle, que incentivam os usuários a evitar a geração de imagens de pessoas reais – incluindo celebridades – sem o seu consentimento.

Por enquanto, a graça salvadora do Viggle pode ser que seu resultado ainda não é cem por cento realista. A tecnologia é realmente impressionante, mas sabemos melhor. Aquela animação maluca do Coringa definitivamente não é real, mas com certeza é engraçada.

Últimas

Câmeras Waymo capturam imagens de pessoa acusada de supostos cortes de pneus de robotaxi

Um morador de Castro Valley foi acusado na...

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta...

César Lattes, físico e professor brasileiro, é homenageado no Google

Hoje, o Google celebra com um Doodle animado...

Assine

spot_img

Veja Também

Câmeras Waymo capturam imagens de pessoa acusada de supostos cortes de pneus de robotaxi

Um morador de Castro Valley foi acusado na...

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta...

César Lattes, físico e professor brasileiro, é homenageado no Google

Hoje, o Google celebra com um Doodle animado...

O WhatsApp agora permite que empresas enviem códigos de autenticação para usuários na Índia

O WhatsApp agora permite que empresas enviem códigos...
spot_img

Câmeras Waymo capturam imagens de pessoa acusada de supostos cortes de pneus de robotaxi

Um morador de Castro Valley foi acusado na quinta-feira por supostamente cortar os pneus de 17 robotaxis Waymo em São Francisco entre 24...

SoftBank adquire fabricante de chips de IA do Reino Unido Graphcore

Empresa de chips do Reino Unido Gráficooré foi formalmente adquirida pelo SoftBank do Japão.Rumores do acordo abundam há algum tempomas negociações prolongadas e...

Pesquisadores do Google alertam que a IA está destruindo a internet

Um estudo feito por pesquisadores do Google aponta que a IA generativa, a mesma que a gigante de Mountain View está super incentivando,...