Posts Recentes:

Betaworks aposta em agentes de IA na última coorte de ‘Camp’


Betaworks está abraçando a tendência da IA ​​não com mais um LLM, mas sim com um conjunto de modelos do tipo agente que automatizam tarefas diárias que, no entanto, não são tão simples de definir. A mais recente incubadora “Camp” do investidor treinou e financiou 9 startups de agentes de IA que eles esperam que assumam as tarefas mais tediosas de hoje.

Os casos de uso para muitas dessas empresas parecem promissores, mas a IA tende a ter dificuldade em cumprir suas promessas. Você confiaria em uma IA novinha em folha para classificar seu e-mail para você? Que tal extrair e estruturar informações de uma página web? Alguém se importará com reuniões de IA onde quer que funcione?

Há um elemento de confiança que ainda não foi estabelecido com estes serviços, algo que ocorre com a maioria das tecnologias que mudam a forma como agimos. Pedir instruções ao MapQuest parecia estranho até que deixou de acontecer – e agora a navegação GPS é uma ferramenta diária. Mas os agentes de IA estão nesse estágio? O CEO e fundador da Betaworks, John Borthwick, pensa assim. (Divulgação: o ex-editor do TechCrunch e apresentador do Disrupt, Jordan Crook, deixou TC para trabalhar na empresa.)

“Você está se concentrando em algo em que passamos muito tempo pensando”, disse ele ao TechCrunch. “Embora a IA agente esteja em seu nascimento – e haja problemas em torno das taxas de sucesso dos agentes, etc. – estamos vendo avanços tremendos desde o início do Camp.”

Embora a tecnologia continue melhorando, Borthwick explicou que alguns clientes estão prontos para adotá-la em seu estado atual.

“Historicamente, vimos clientes acreditarem, mesmo em tarefas de alto risco, se um produto fosse 'bom o suficiente'. O Bill.com original, apesar de fazer coisas interessantes com OCR e raspagem de e-mail, nem sempre acertava, e os usuários ainda confiavam nele milhares de dólares em transações porque tornava uma tarefa terrível menos terrível. E com o tempo, por meio de um design de interface altamente comunicativo, os ciclos de feedback desses clientes criaram um produto ainda melhor e mais confiável”, disse ele.

“Por enquanto, a maioria dos primeiros usuários dos produtos no Camp são desenvolvedores, fundadores e primeiros adotantes de tecnologia, e esse grupo sempre esteve disposto a testar pacientemente e fornecer feedback sobre esses produtos, que eventualmente se tornarão populares.”

Betaworks Camp é um acelerador de três meses no qual empresas selecionadas no tema escolhido recebem ajuda prática com seus produtos, estratégias e conexões antes de serem expulsas com um cheque de US$ 500 mil – cortesia da própria Betaworks, Mozilla Ventures, Differential Ventures e Stem AI. Mas não antes das startups se exibirem no dia da demonstração, 7 de maio.

No entanto, demos uma olhada na programação de antemão. Aqui estão os três que mais me chamaram a atenção.

Twin automatiza tarefas usando um “modelo de ação” como o que temos ouvi Coelho falar sobre há alguns meses (mas ainda não foram enviados). Ao treinar um modelo em muitos dados que representam interfaces de software, ele pode (afirmam essas empresas) aprender como concluir tarefas comuns, coisas que são mais complexas do que uma API pode lidar, mas não tanto que não possam ser delegadas a um “estagiário inteligente.” Na verdade, nós os escrevemos em janeiro.

twin process

Portanto, em vez de um engenheiro de back-end criar um script personalizado para realizar uma determinada tarefa, você pode demonstrar ou descrever em linguagem comum. Coisas como “colocar todos os currículos que recebemos hoje em uma pasta no Dropbox e renomeá-los com o nome do candidato, depois me mande um DM com o link de compartilhamento no Slack”. E depois de ajustar esse fluxo de trabalho (“Opa, desta vez adicione a data do aplicativo aos nomes dos arquivos”), ele pode ser apenas a nova maneira como o processo funciona. Automatizar 20% das tarefas que ocupam 80% do nosso tempo é o objetivo da empresa – se isso pode ser feito de maneira acessível é provavelmente a verdadeira questão. (Twin se recusou a entrar em detalhes sobre a natureza de seu modelo e processo de treinamento.)

Skej visa amenizar o processo ocasionalmente doloroso de encontrar um horário de reunião que funcione para duas (ou três, ou quatro…) pessoas. Basta enviar uma cópia ao bot em um e-mail ou tópico do Slack e ele iniciará o processo de reconciliação da disponibilidade e preferências de todos. Se tiver acesso aos horários, irá verificá-los; se alguém disser que prefere a tarde se for quinta-feira, funciona com isso; você pode dizer que algumas pessoas têm prioridade; e assim por diante. Qualquer pessoa que trabalhe com um assistente executivo qualificado sabe que eles são insubstituíveis, mas é provável que todos os EA prefiram gastar menos tempo em tarefas que são apenas um monte de “Que tal isso? Não? Que tal agora?”

skej test

Créditos da imagem: Skej

Como misantropo, não tenho esse problema de agendamento, mas agradeço que outros tenham, e também preferiria uma solução do tipo “configure e esqueça”, onde eles apenas concordam com os resultados. E está dentro das capacidades dos agentes de IA de hoje, que teriam principalmente a tarefa de compreender a linguagem natural em vez de formas.

JSONify é uma evolução dos scrapers de sites que podem extrair dados de contextos relativamente não estruturados. Isso tem sido feito há muito tempo, mas o mecanismo que extrai as informações nunca foi tão inteligente. Se for um documento grande e plano, eles funcionam bem – se estiver em guias no local ou em alguma lista visual mal codificada, destinada a humanos clicarem, eles podem falhar. Jsonify usa a compreensão aprimorada dos modelos visuais de IA atuais para analisar e classificar melhor os dados que podem ser inacessíveis para rastreadores simples.

jsonify

Créditos da imagem: JSONify

Então você poderia fazer uma busca por opções do Airbnb em uma determinada área e, em seguida, fazer com que o Jsonify colocasse todas elas em uma lista estruturada com colunas de preço, distância do aeroporto, classificação, taxas ocultas, etc. e extrair os mesmos dados – talvez para os mesmos lugares (fiz isso e economizei cerca de US $ 150 outro dia, mas gostaria de ter automatizado o processo). Ou, você sabe, faça coisas profissionais.

Mas a imprecisão inerente aos LLMs não os torna uma ferramenta questionável para o trabalho? “Conseguimos construir um sistema de proteção e verificação cruzada bastante robusto”, disse o fundador Ananth Manivannan. “Usamos alguns modelos diferentes em tempo de execução para entender a página, o que fornece alguma validação — e os LLMs que usamos são ajustados ao nosso caso de uso, portanto, geralmente são bastante confiáveis, mesmo sem a camada de proteção. Normalmente vemos mais de 95% de precisão de extração, dependendo do caso de uso.”

Eu poderia ver qualquer um deles sendo útil provavelmente em qualquer negócio de tecnologia avançada. Os outros da coorte são um pouco mais técnicos ou situacionais – aqui estão os 6 restantes:

  • IA resolvida – automação de agentes de fluxos de trabalho em nuvem. Parece útil até que integrações personalizadas o alcancem.
  • Inundação – um organizador de caixa de entrada de IA que lê seu e-mail e encontra coisas importantes enquanto prepara respostas e ações apropriadas.
  • IA extensível – sua IA está regredindo? Pergunte ao seu médico se o Extensible é a infra-estrutura de teste e registro certa para sua implantação.
  • Adversário – um personagem virtual feito para as crianças interagirem e brincarem extensivamente. Parece um campo minado ética e legalmente, mas alguém precisa passar por ele.
  • Pesquisa de alta dimensão – o jogo infra. Uma estrutura para agentes de IA baseados na web com um modelo de pagamento conforme o uso, de modo que, se o experimento da sua empresa falhar, você deverá apenas alguns dólares.
  • Mbodi – IA generativa para robótica, um campo onde os dados de formação são comparativamente escassos. Achei que fosse uma palavra africana, mas é apenas “incorporar”.

Não há dúvidas de que os agentes de IA desempenharão algum papel nos fluxos de trabalho de software cada vez mais automatizados do futuro próximo, mas a natureza e a extensão desse papel ainda não estão escritas. Claramente, a Betaworks pretende entrar no mercado o mais cedo possível, mesmo que alguns dos produtos ainda não estejam prontos para sua estreia no mercado de massa.

Você poderá ver as empresas mostrarem seus produtos agentes no dia 7 de maio.

Últimas

Assine

spot_img

Veja Também

Copilot Workspace é a abordagem do GitHub sobre engenharia de software baseada em IA

O futuro do desenvolvimento de software será um...

5 coisas a considerar antes de uma migração de site

Uma das tarefas de SEO mais assustadoras é...
spot_img

Copilot Workspace é a abordagem do GitHub sobre engenharia de software baseada em IA

O futuro do desenvolvimento de software será um IDE baseado em IA? O GitHub está apresentando a ideia. Em sua conferência anual GitHub...

Backflip levanta US$ 15 milhões para ajudar investidores imobiliários a vender casas

Virar casas não é para os fracos de coração, não importa o quão divertido ou fácil a HGTV possa parecer. Uma startup quer tornar...

O cofundador do Twitter, Biz Stone, junta-se ao conselho da nova organização sem fins lucrativos Mastodon nos EUA

Biz Stone, cofundador do Twitter, está entre aqueles que se juntaram ao conselho de administração da nova organização sem fins lucrativos da Mastodon...