Posts Recentes:

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona...

Perguntas e respostas sobre robótica com Ken Goldberg da UC Berkeley


Nas próximas semanas, o boletim informativo de robótica do TechCrunch, Actuator, fará perguntas e respostas com algumas das principais mentes da robótica. Inscreva-se aqui para atualizações futuras.

Parte 1: Matthew Johnson-Roberson da CMU
Parte 2: Max Bajracharya e Russ Tedrake, do Toyota Research Institute
Parte 3: Dhruv Batra de Meta
Parte 4: Aaron Saunders, da Boston Dynamics

Ken Goldberg é professor e titular ilustre de engenharia da William S. Floyd Jr. na UC Berkeley, cofundador e cientista-chefe da startup de classificação de pacotes robóticos Ambidestro e bolsista do IEEE.

Que papel(s) a IA generativa desempenhará no futuro da robótica?

Embora os rumores tenham começado um pouco mais cedo, 2023 será lembrado como o ano em que a IA generativa transformou a robótica. Grandes modelos de linguagem como o ChatGPT podem permitir que robôs e humanos se comuniquem em linguagem natural. As palavras evoluíram ao longo do tempo para representar conceitos úteis, de “cadeira” a “chocolate” e “carisma”. Os roboticistas também descobriram que grandes sistemas de Visão-Linguagem-Ação modelos podem ser treinados para facilitar a percepção do robô e controlar os movimentos dos braços e pernas do robô. O treinamento requer grandes quantidades de dados, por isso laboratórios em todo o mundo estão agora colaborando para compartilhar dados. Os resultados estão a chegar e, embora ainda haja questões em aberto sobre a generalização, o impacto será profundo.

Outro tópico interessante são os “modelos multimodais” em dois sentidos de multimodal:

  • Multimodal na combinação de diferentes modos de entrada, por exemplo, Visão e Linguagem. Isso agora está sendo estendido para incluir detecção tátil e de profundidade e ações do robô.
  • Multimodal em termos de permitir diferentes ações em resposta ao mesmo estado de entrada. Isto é surpreendentemente comum na robótica; por exemplo, existem muitas maneiras de compreender um objeto. Os modelos profundos padrão farão a “média” dessas ações de compreensão, que podem produzir uma compreensão muito fraca. Uma forma muito interessante de preservar ações multimodais são as Políticas de Difusão, desenvolvidas por Shuran Song, agora em Stanford.

O que você acha do fator de forma humanóide?

Sempre fui cético em relação aos humanóides e robôs com pernas, pois eles podem ser excessivamente sensacionais e ineficientes, mas estou reconsiderando depois de ver os mais recentes humanóides e quadrúpedes da Boston Dynamics, Agility e Unitree. A Tesla possui as habilidades de engenharia para desenvolver motores e sistemas de engrenagens de baixo custo em grande escala. Os robôs com pernas têm muitas vantagens sobre as rodas em casas e fábricas para atravessar degraus, detritos e tapetes. Robôs bimanuais (de dois braços) são essenciais para muitas tarefas, mas ainda acredito que garras simples continuarão a ser mais confiáveis ​​e econômicas do que mãos robóticas de cinco dedos.

Depois da fabricação e dos armazéns, qual é a próxima categoria importante da robótica?

Após os recentes acordos salariais sindicais, penso que veremos muito mais robôs nas fábricas e nos armazéns do que temos hoje. O progresso recente nos táxis autônomos tem sido impressionante, especialmente em São Francisco, onde as condições de condução são mais complexas do que em Phoenix. Mas não estou convencido de que possam ser rentáveis. Para cirurgia assistida por robô, os pesquisadores estão explorando a “Destreza Aumentada” – onde os robôs podem aprimorar as habilidades cirúrgicas realizando subtarefas de baixo nível, como sutura.

Quão distantes estão os verdadeiros robôs de uso geral?

Não espero ver verdadeiros robôs AGI e de uso geral no futuro próximo. Nem um único roboticista que conheço se preocupa com o fato de robôs roubarem empregos ou se tornarem nossos senhores.

Os robôs domésticos (além dos aspiradores) decolarão na próxima década?

Prevejo que na próxima década teremos robôs domésticos acessíveis que poderão organizar – recolher coisas como roupas, brinquedos e lixo do chão e colocá-los em recipientes apropriados. Tal como os aspiradores de hoje, estes robôs cometerão erros ocasionalmente, mas os benefícios para os pais e os idosos serão superiores aos riscos.

Que história/tendência importante da robótica não está recebendo cobertura suficiente?

Planejamento de movimento do robô. Este é um dos assuntos mais antigos da robótica – como controlar as articulações motoras para mover a ferramenta robótica e evitar obstáculos. Muitos pensam que este problema foi resolvido, mas não foi.

As “singularidades” dos robôs são um problema fundamental para todos os braços robóticos; eles são muito diferentes do momento hipotético de Kurzweil em que a IA ultrapassa os humanos. As singularidades do robô são pontos no espaço onde um robô para inesperadamente e deve ser reiniciado manualmente por um operador humano. As singularidades surgem da matemática necessária para converter o movimento em linha reta desejado da pinça nos movimentos correspondentes para cada um dos seis motores articulados do robô. Em certos pontos do espaço, esta conversão torna-se instável (semelhante a um erro de divisão por zero) e o robô precisa ser reiniciado.

Para movimentos repetitivos do robô, as singularidades podem ser evitadas através do tedioso ajuste manual dos movimentos repetitivos do robô para ajustá-los de forma que nunca encontrem singularidades. Uma vez determinados esses movimentos, eles são repetidos indefinidamente. Mas para a crescente geração de aplicações onde os movimentos do robô não são repetitivos, incluindo paletização, recolha de contentores, atendimento de pedidos e classificação de embalagens, as singularidades são comuns. Eles são um problema bem conhecido e fundamental, pois interrompem as operações do robô em momentos imprevisíveis (muitas vezes, várias vezes por hora). Fui cofundador de uma nova startup, Jacobi Robotics, que implementa algoritmos eficientes que são *garantidos* para evitar singularidades. Isto pode aumentar significativamente a confiabilidade e a produtividade de todos os robôs.

Últimas

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona...

O Copilot Enterprise do GitHub agora está disponível por US$ 39 por mês

GitHub anunciou hoje a disponibilidade geral do Copilot...

Assine

spot_img

Veja Também

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona...

O Copilot Enterprise do GitHub agora está disponível por US$ 39 por mês

GitHub anunciou hoje a disponibilidade geral do Copilot...

Google celebra Casimir Funk, o químico pioneiro das vitaminas

O Google fez uma homenagem ao bioquímico polonês-americano...
spot_img

6 maneiras de otimizar GPTs para aumentar a visibilidade e o envolvimento online

GPTs, a forma sem código de criar experiências ChatGPT personalizadas a partir do OpenAI, permitem que as marcas alcancem usuários ChatGPT na Loja...

TikTok perde ainda mais músicas por causa de sua disputa com o Universal Music Group

O TikTok está perdendo ainda mais músicas por causa de sua briga com o Universal Music Group (UMG), já que a rede social...

Splitscreen traz uma configuração de vários monitores para o Vision Pro da Apple

Pronto para uso, Vision Pro da Apple funciona como um monitor virtual 4K Mac, permitindo estender um desktop Mac existente ao ambiente de...