Browser Use, uma start-up americana que visa transformar a maneira como os agentes de IA interagem com a web, anunciou recentemente uma captação de recursos de 17 milhões de dólares em uma rodada de financiamento seed liderada pela Felicis Ventures, com a participação de A Capital, Nexus Ventures, Y Combinator, Paul Graham, Liquid2, SV Angel, e Pioneer Fund. 

Construindo a interface entre os LLMs e a web 

Browser Use surgiu em 2024 sob a liderança de Magnus Müller e Gregor Žunič, dois ex-estudantes de ciência de dados da ETH Zurich. Seu projeto nasceu de uma simples experiência de fim de semana visando testar se os modelos de linguagem (LLMs) poderiam navegar na web como humanos. Em apenas quatro dias, eles desenvolveram um protótipo inicial que lançaram na plataforma Hacker News. O entusiasmo foi imediato, confirmando sua intuição de que o futuro da automação web impulsionada por IA estava mais próximo do que muitos pensavam. Algumas semanas depois, a primeira demonstração estava pronta.
Os dois cofundadores asseguram:
"A Internet é a maior fonte de dados não estruturados do mundo, mas interagir com ela ainda requer ações humanas: clicar em botões, preencher formulários, navegar manualmente em sites. Com o avanço dos LLMs e dos agentes autônomos, essa realidade está mudando. Estamos construindo a infraestrutura que permite à IA interagir com a web tão naturalmente quanto um humano."
A maioria das soluções de automação existentes baseia-se em métodos baseados na visão, tentando imitar a percepção humana das páginas web. Sensíveis às variações visuais (mudança de cor, posição dos elementos...), elas são para os dois homens "lentas, caras e pouco confiáveis".  Eles, portanto, adotaram uma estratégia radicalmente diferente: sua ferramenta converte as interfaces web em texto estruturado, permitindo que os modelos de linguagem interajam com os sites de maneira mais previsível. Essa abordagem permite uma interação mais precisa com os elementos da interface do usuário (botões, formulários, menus) ao mesmo tempo em que garante uma execução mais rápida e econômica do que as soluções baseadas na análise de imagens.
Ao contrário da maioria de seus concorrentes, o Brower Use Cloud pode ser usado com diferentes LLMs. Sua versão Pro é oferecida pela start-up por 30 $/mês, o que o torna uma alternativa open source mais flexível e menos onerosa que o Operator da OpenAI.

Uma rápida tração e casos de uso variados

Em apenas alguns meses, Browser Use experimentou um crescimento impressionante. Seu projeto open source, ao qual uma comunidade de mais de 15.000 desenvolvedores contribui ativamente, acumula mais de 48.400 estrelas no GitHub. Suas ferramentas cobrem diversos casos de uso, incluindo automação de login e navegação na web, extração de dados em larga escala, testes de garantia de qualidade ou integrações CRM.
Com essa captação de recursos, Browser Use pretende acelerar o desenvolvimento de sua infraestrutura e, para isso, planeja recrutar os melhores engenheiros.
Magnus Müller comenta:
"Acreditamos firmemente que a interação entre a IA e a web passará por uma transformação significativa nos próximos anos. Daqui a alguns anos, pensamos que as interações automatizadas por IA superarão aquelas realizadas por humanos."

Para entender melhor

O que é a tecnologia de conversão de interfaces web em texto estruturado e por que é importante para Browser Use?

A tecnologia de conversão de interfaces web em texto estruturado permite que modelos de linguagem tratem sites como bases de dados textuais, melhorando a precisão e a confiabilidade em comparação com métodos visuais. Isso é crucial para o Browser Use, pois reduz a dependência da percepção humana e das variações visuais, tornando a automação mais rápida e econômica.

Como a captação de recursos de Browser Use por vários investidores influencia suas capacidades de desenvolvimento e inovação?

A diversidade de investidores da Browser Use, como a Felicis Ventures e o Y Combinator, oferece não apenas recursos financeiros, mas também uma rede estratégica de conselhos e parcerias. Isso acelera seu desenvolvimento tecnológico e inovação, fortalecendo sua posição no campo da automação web.