Google explora o potencial dos vídeos no treinamento de robôs

O Google divulgou recentemente novos métodos para treinar robôs utilizando vídeos, visando aprimorar o entendimento dessas máquinas.

A equipe de pesquisadores do Google DeepMind Robotics tem explorado o potencial dessa abordagem, que combina inteligência artificial generativa com modelos de base ampla.

Em um post de blog, eles destacam as pesquisas em andamento para que os robôs compreendam melhor o que os seres humanos esperam deles.

Tradicionalmente, os robôs são projetados para executar uma única tarefa repetidamente ao longo de sua vida útil. Embora sejam eficientes nessa função específica, eles enfrentam dificuldades quando ocorrem mudanças ou erros não intencionais.

Google explora o potencial dos videos no treinamento de robos

O novo método chamado AutoRT utiliza modelos de base ampla para diversos fins. Em um exemplo dado pela equipe do DeepMind, o sistema utiliza um Modelo de Linguagem Visual (VLM) para uma melhor percepção da situação.

O AutoRT é capaz de gerenciar um grupo de robôs que trabalham em conjunto, equipados com câmeras para obter uma visão do ambiente e dos objetos presentes nele.

Além disso, um grande modelo de linguagem (LLM, na sigla em inglês) sugere tarefas que podem ser realizadas pelo hardware, incluindo o efetuador final do robô.

Os LLMs são considerados essenciais para que os robôs compreendam com eficácia comandos em linguagem natural, reduzindo a necessidade de programação rígida.

O sistema AutoRT já passou por extensos testes nos últimos meses. Ele é capaz de coordenar até 20 robôs simultaneamente, com um total de 52 dispositivos diferentes. Ao todo, o DeepMind coletou mais de 77.000 experimentos, abrangendo mais de 6.000 tarefas.

Outra novidade apresentada pela equipe é o RT-Trajectory, que utiliza vídeos como entrada para o aprendizado dos robôs.

Muitas equipes estão explorando o uso de vídeos do YouTube para treinar robôs em grande escala, mas o RT-Trajectory adiciona uma camada interessante, sobrepondo um esboço bidimensional do movimento do braço sobre o vídeo.

A equipe afirma que o treinamento com o RT-Trajectory teve o dobro de taxa de sucesso em comparação com o treinamento RT-2, atingindo 63% em 41 tarefas.

Esses avanços não apenas contribuem para o desenvolvimento de robôs capazes de se mover com precisão e eficiência em situações novas, mas também possibilitam aproveitar o conhecimento de conjuntos de dados existentes.

Adicione o SEO Fórum ao seu feed do Google Notícias.

Cookie	Duração	Descrição
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

SEO Fórum

Conteúdo

Redes Sociais

Posts Recentes:

A NASA está expandindo suas instalações na Ilha Wallops para suportar três vezes mais lançamentos

Três coisas que aprendemos sobre os planos de IA da Apple com seus ganhos

Como escrever prompts do ChatGPT para obter os melhores resultados

SEO Fórum

Conteúdo

Redes Sociais

Google explora o potencial dos vídeos no treinamento de robôs

Últimas

A NASA está expandindo suas instalações na Ilha Wallops para suportar três vezes mais lançamentos

Três coisas que aprendemos sobre os planos de IA da Apple com seus ganhos

Como escrever prompts do ChatGPT para obter os melhores resultados

A indústria lamenta a perda de Mark Irvine

Assine

Veja Também

A NASA está expandindo suas instalações na Ilha Wallops para suportar três vezes mais lançamentos

Três coisas que aprendemos sobre os planos de IA da Apple com seus ganhos

Como escrever prompts do ChatGPT para obter os melhores resultados

A indústria lamenta a perda de Mark Irvine

Archer, de propriedade da Match, atinge mais de meio milhão de instalações em meio à queda do aplicativo de namoro

A NASA está expandindo suas instalações na Ilha Wallops para suportar três vezes mais lançamentos

Três coisas que aprendemos sobre os planos de IA da Apple com seus ganhos

Como escrever prompts do ChatGPT para obter os melhores resultados

Institucional

Mais Recentes

A NASA está expandindo suas instalações na Ilha Wallops para suportar três vezes mais lançamentos

Três coisas que aprendemos sobre os planos de IA da Apple com seus ganhos

Como escrever prompts do ChatGPT para obter os melhores resultados

A indústria lamenta a perda de Mark Irvine

Mais Populares

6 razões pelas quais seus relatórios do GA4 não estão somando

Como Adicionar Imagens Facilmente no WordPress

Microsoft relança pubCenter

Este ex-futuro unicórnio será vendido por peças?

Assine