Posts Recentes:

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É...

Como adaptar seu marketing para a nova era da análise de dados

Não é exagero dizer que o cenário dos...

Google espera corrigir o problema histórico de diversidade de imagens de Gemini dentro de semanas


O Google está esperançoso de que em breve será capaz de ‘retomar’ a capacidade de sua ferramenta multimodal de IA generativa, Gemini, de representar pessoas, de acordo com o fundador da DeepMind, Demis Hassabis. A capacidade de responder a solicitações de imagens de humanos deve voltar a estar online nas “próximas semanas”, disse ele hoje.

O Google suspendeu o recurso Gemini semana passada depois que os usuários apontaram que a ferramenta estava produzindo imagens historicamente incongruentes, como a representação dos pais fundadores dos EUA como um grupo diversificado de pessoas, em vez de apenas homens brancos.

Hassabis estava respondendo a perguntas sobre a confusão do produto durante uma entrevista no palco do Mobile World Congress em Barcelona hoje.

Questionado pelo moderador Steven Levy, da Wired, para explicar o que havia de errado com o recurso de geração de imagens, Hassabis evitou uma explicação técnica detalhada. Em vez disso, ele sugeriu que o problema foi causado pela falha do Google em identificar casos em que os usuários estão basicamente atrás do que ele descreveu como uma “representação universal”. O exemplo aponta para “nuances que acompanham a IA avançada”, disse ele também.

“Este é um campo com o qual todos estamos lutando. Então se você, por exemplo, colocar um prompt que pede, me dê uma foto de uma pessoa passeando com um cachorro ou uma enfermeira em um hospital, certo, nesses casos, você claramente quer uma espécie de 'representação universal'. Especialmente se você considerar que, como Google, atendemos mais de 200 países, você sabe, todos os países ao redor do mundo – então você não sabe de onde o usuário vem e qual será sua formação ou em que contexto ele está. você quer mostrar uma espécie de gama universal de possibilidades.”

Hassabis disse que a questão se resumia a um “recurso bem intencionado” – promover uma diversidade nas imagens de pessoas da Gemini – que foi aplicado “de forma muito direta, em tudo isso”.

As solicitações que solicitam conteúdo sobre pessoas históricas deveriam “é claro” resultar em “uma distribuição muito mais restrita que você retribui”, acrescentou, sugerindo como a Gemini poderá lidar com as solicitações para pessoas no futuro.

“Nós nos preocupamos, é claro, com a precisão histórica. E então colocamos esse recurso off-line enquanto consertamos isso e, você sabe, esperamos tê-lo on-line novamente no próximo – em muito pouco tempo. Nas próximas semanas, nas próximas semanas.”

Respondendo a uma pergunta complementar sobre como evitar que ferramentas generativas de IA sejam apropriadas indevidamente por maus intervenientes, como regimes autoritários que procuram espalhar propaganda, Hassabis não teve uma resposta simples. A questão é “muito complexa”, sugeriu – provavelmente exigindo uma mobilização e resposta de toda a sociedade para determinar e impor limites.

“Há pesquisas e debates realmente importantes que precisam acontecer – também com a sociedade civil e os governos, não apenas com as empresas de tecnologia”, disse ele. “É uma questão técnica social que afeta a todos e deveria envolver todos para discuti-la. Que valores queremos que estes sistemas tenham? O que eles representariam? Como você evita que atores mal-intencionados acessem as mesmas tecnologias e, do que você está falando, que é redirecioná-las para fins prejudiciais que não foram pretendidos pelos criadores desses sistemas.”

Abordando o desafio dos modelos de IA de uso geral de código aberto, que o Google também ofereceele acrescentou: “Os clientes querem usar sistemas de código aberto que possam controlar totalmente… Mas então surge a questão: como garantir que o que as pessoas usam no downstream não será prejudicial para esses sistemas à medida que se tornam cada vez mais poderosos?

“Acho que hoje isso não é um problema porque os sistemas ainda são relativamente incipientes. Mas se avançarmos três, quatro ou cinco anos e começarmos a falar sobre sistemas da próxima geração com capacidades de planeamento e capazes de agir no mundo e resolver problemas e objectivos, penso que a sociedade tem mesmo de pensar seriamente sobre estas questões – sobre o que acontece se isso proliferar, e então maus atores, desde indivíduos até estados desonestos, podem fazer uso deles também.”

Durante a entrevista, Hassabis também foi questionado sobre sua opinião sobre os dispositivos de IA e para onde o mercado móvel pode se dirigir à medida que a IA generativa continua a impulsionar novos desenvolvimentos aqui. Ele previu uma onda de “assistentes inteligentes da próxima geração” que são úteis na vida cotidiana das pessoas, em vez das coisas “enigmáticas” das gerações anteriores de assistentes de IA, como ele disse, e que ele sugeriu que podem até remodelar o hardware móvel que as pessoas escolhem para embalar. em sua pessoa.

“Acho que até haverá dúvidas sobre qual é o tipo de dispositivo certo”, sugeriu ele. “Mas daqui a mais de cinco anos, será que o telefone realmente terá o formato perfeito? Talvez precisemos de óculos ou outras coisas para que o sistema de IA possa realmente ver um pouco do contexto em que você está e assim ser ainda mais útil em sua vida diária. Então, acho que há todo tipo de coisas incríveis a serem inventadas.”

Leia mais sobre o MWC 2024 no TechCrunch

Últimas

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É...

Como adaptar seu marketing para a nova era da análise de dados

Não é exagero dizer que o cenário dos...

Assine

spot_img

Veja Também

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É...

Como adaptar seu marketing para a nova era da análise de dados

Não é exagero dizer que o cenário dos...

Reddit recebe tratamento especial do Google?

Especialistas em SEO tem questionado se o Google...
spot_img

A Perplexity está levantando mais de US$ 250 milhões com uma avaliação de US$ 2,5 a US$ 3 bilhões para sua plataforma de pesquisa...

Perplexity, a inicialização do mecanismo de busca de IA, é uma propriedade em alta no momento. O TechCrunch descobriu que a empresa...

Google E-E-A-T: o que é isso?

No mundo digital, a confiança é fundamental. É por isso que o Google vem aprimorando seus critérios de pesquisa, priorizando conteúdos que demonstram...

Como adaptar seu marketing para a nova era da análise de dados

Não é exagero dizer que o cenário dos dados de marketing mudou bastante nos últimos dois anos. Por um lado, o maneiras...