Posts Recentes:

Google Chat recebe atualização com novo logotipo e recursos de pesquisa aprimorados

O Google Chat está passando por mudanças significativas,...

Poppy diz 'sim' ao novo capital para reservas digitais e entrega de flores de casamento

A tecnologia se infiltrou em muitas das facetas...

A IA incorporada gira uma caneta e ajuda a limpar a sala de estar em uma nova pesquisa


Simples, a IA pode ortografar sonetos e fazer um trabalho suportável Capa do Nirvana de Homer Simpson. Mas se alguém quiser dar as boas-vindas aos nossos novos senhores da tecnologia, precisará ser capaz de um pouco mais prático – e é por isso que Meta e Nvidia têm seus sistemas praticando de tudo, desde truques com caneta até trabalhos domésticos colaborativos.

Coincidentemente, os dois gigantes da tecnologia publicaram novas pesquisas esta manhã relacionadas ao ensino de modelos de IA para interagir com o mundo real, basicamente por meio do uso inteligente de um mundo simulado.

Acontece que o mundo real não é unicamente um lugar multíplice e confuso, mas também lento. Os agentes que aprendem a controlar robôs e a realizar tarefas porquê terebrar uma gaveta e colocar um pouco dentro podem ter que repetir essa tarefa centenas ou milhares de vezes. Isso levaria dias – mas se você fizer isso em um simulacro razoavelmente realista do mundo real, eles poderão aprender a ter um desempenho quase tão bom em unicamente um ou dois minutos.

Usar simuladores não é novidade, mas a Nvidia adicionou uma estrato suplementar de automação, aplicando um grande padrão de linguagem para ajudar a ortografar o código de tirocínio por reforço que orienta uma IA ingênua para executar melhor uma tarefa. Eles chamam isso Kit de recompensa universal orientado para a evolução para agente, ou EUREKA. (Sim, é um excesso.)

Digamos que você queira ensinar um agente a pegar e qualificar objetos por cor. Existem muitas maneiras de definir e codificar essa tarefa, mas algumas podem ser melhores que outras. Por exemplo, um robô deveria priorizar menos movimentos ou diminuir o tempo de desfecho? Os humanos são bons em codificá-los, mas desvendar qual é o melhor às vezes pode ser uma questão de tentativa e erro. O que a equipe da Nvidia descobriu foi que um LLM treinado em código era surpreendentemente bom nisso, superando os humanos na maior secção do tempo na eficiência da função de recompensa. Ele até itera em seu próprio código, melhorando à medida que avança e ajudando-o a generalizar para diferentes aplicações.

NVIDIA Eureka Gif

Créditos da imagem: Nvidia

O impressionante truque da caneta supra é unicamente simulado, mas foi criado usando muito menos tempo e experiência humana do que seria necessário sem o EUREKA. Usando a técnica, os agentes tiveram um desempenho magnífico em um conjunto de outras tarefas virtuais de destreza e locomoção. Aparentemente ele consegue usar uma tesoura muito muito, o que é… provavelmente bom.

Fazer com que essas ações funcionem no mundo real é, obviamente, outro repto dissemelhante – na verdade, “incorporar” a IA. Mas é um sinal evidente de que a adoção da IA ​​generativa pela Nvidia não é unicamente conversa.

Novos habitats para futuros companheiros robôs

A Meta também está na trilha da IA ​​incorporada e anunciou alguns avanços hoje, começando com uma novidade versão de seu conjunto de dados “Habitat”. A primeira versão disso foi lançada em 2019, basicamente um conjunto de ambientes 3D quase fotorrealistas e cuidadosamente anotados pelos quais um agente de IA poderia velejar. Novamente, ambientes simulados não são novos, mas Meta estava tentando torná-los um pouco mais fáceis de encontrar e trabalhar.

Saiu com versão 2.0 posterior, com mais ambientes muito mais interativos e fisicamente realistas. Eles começaram a edificar uma livraria de objetos que também poderiam preencher esses ambientes – um pouco que muitas empresas de IA acharam que vale a pena fazer.

Agora temos Habitat 3.0, que acrescenta a possibilidade de avatares humanos compartilharem o espaço via VR. Isso significa que pessoas, ou agentes treinados no que as pessoas fazem, podem entrar no simulador com o robô e interagir com ele ou com o envolvente ao mesmo tempo.

Parece simples, mas é uma capacidade muito importante. Digamos que você queira treinar um robô para limpar a sala de estar, trazendo pratos da mesa de núcleo para a cozinha e colocando peças de roupa perdidas em um cesto. Se o robô estiver sozinho, ele poderá desenvolver uma estratégia para fazer isso que poderia ser facilmente interrompida por uma pessoa andando por perto, talvez até mesmo fazendo secção do trabalho para ele. Mas com um agente humano ou humano compartilhando o espaço, ele pode realizar a tarefa milhares de vezes em poucos segundos e aprender a trabalhar com eles ou em torno deles.

Eles chamam a tarefa de limpeza de “rearranjo social” e outra importante de “navegação social”. É cá que o robô precisa seguir alguém discretamente para, digamos, permanecer ao alcance do som ou observá-lo por razões de segurança – pense em um pequeno bot que acompanha alguém no hospital até o banheiro.

spot irl

Um robô Spot no mundo real realizando uma tarefa de escolher e colocar. Créditos da imagem: meta

Um novo banco de dados de interiores 3D chamado HSSD-200 também melhora a fidelidade dos ambientes. Eles descobriram que treinar em muro de centena dessas cenas de subida fidelidade produziu melhores resultados do que treinar em 10 milénio cenas de baixa fidelidade.

Meta também falou sobre uma novidade rima de simulação robótica, HomeRobot, para Spot da Boston Dynamics e Stretch da Hello Robot. A sua esperança é que, ao padronizar alguns softwares básicos de navegação e manipulação, eles permitam que os investigadores nesta espaço se concentrem em coisas de nível superior onde a inovação está à espera.

Habitat e HomeRobot estão disponíveis sob uma licença do MIT em suas páginas do GitHub, e HSSD-200 está sob uma licença não mercantil Creative Commons – portanto vão para a cidade, pesquisadores.

Últimas

Google Chat recebe atualização com novo logotipo e recursos de pesquisa aprimorados

O Google Chat está passando por mudanças significativas,...

A união entre Microsoft e OpenAI enfrenta escrutínio de 'fusão relevante' pelo regulador do Reino Unido CMA

O turbulento drama de gerenciamento na OpenAI no...

Poppy diz 'sim' ao novo capital para reservas digitais e entrega de flores de casamento

A tecnologia se infiltrou em muitas das facetas...

Google lança NotebookLM, seu carderno inteligente, com tecnologia Gemini Pro

O Google anunciou o lançamento oficial do NotebookLM...

Assine

spot_img

Veja Também

Google Chat recebe atualização com novo logotipo e recursos de pesquisa aprimorados

O Google Chat está passando por mudanças significativas,...

A união entre Microsoft e OpenAI enfrenta escrutínio de 'fusão relevante' pelo regulador do Reino Unido CMA

O turbulento drama de gerenciamento na OpenAI no...

Poppy diz 'sim' ao novo capital para reservas digitais e entrega de flores de casamento

A tecnologia se infiltrou em muitas das facetas...

Google lança NotebookLM, seu carderno inteligente, com tecnologia Gemini Pro

O Google anunciou o lançamento oficial do NotebookLM...
spot_img

Google Chat recebe atualização com novo logotipo e recursos de pesquisa aprimorados

O Google Chat está passando por mudanças significativas, incluindo um novo logotipo e recursos aprimorados de pesquisa.O novo logotipo do Google Chat...

A união entre Microsoft e OpenAI enfrenta escrutínio de 'fusão relevante' pelo regulador do Reino Unido CMA

O turbulento drama de gerenciamento na OpenAI no mês passado terminou com a reintegração do cofundador Sam Altman uma semana após sua demissão...

Poppy diz 'sim' ao novo capital para reservas digitais e entrega de flores de casamento

A tecnologia se infiltrou em muitas das facetas do casamento planejamento na última década, desde registros para desenho de anel para a organização...