Browser Use, una startup estadounidense que aspira a transformar la forma en que los agentes de IA interactúan con la web, anunció recientemente una recaudación de fondos de 17 millones de dólares en una ronda de financiamiento seed liderada por Felicis Ventures, con la participación de A Capital, Nexus Ventures, Y Combinator, Paul Graham, Liquid2, SV Angel y Pioneer Fund. 

Construir la interfaz entre los LLMs y la web 

Browser Use surgió en 2024 impulsada por Magnus Müller y Gregor Žunič, dos ex estudiantes de ciencia de datos de la ETH Zurich. Su proyecto nació de un simple experimento de fin de semana para probar si los modelos de lenguaje (LLMs) podían navegar por la web como humanos. En solo cuatro días, desarrollaron un prototipo inicial que luego lanzaron en la plataforma Hacker News. La respuesta fue inmediata, confirmando su intuición de que el futuro de la automatización web impulsada por IA estaba más cerca de lo que muchos pensaban. Unas semanas después, la primera demo estaba lista.
Los dos cofundadores aseguran:
"Internet es la mayor fuente de datos no estructurados del mundo, pero interactuar con ella todavía requiere acciones humanas: hacer clic en botones, completar formularios, navegar manualmente por los sitios web. Con el auge de los LLMs y los agentes autónomos, esta realidad está cambiando. Estamos construyendo la infraestructura que permite a la IA interactuar con la web tan naturalmente como un humano."
La mayoría de las soluciones de automatización existentes se basan en métodos basados en la visión, intentando imitar la percepción humana de las páginas web.  Sensibles a variaciones visuales (cambio de color, posición de los elementos...), son para los dos hombres "lentas, costosas y poco fiables".  Por lo tanto, adoptaron una estrategia radicalmente diferente: su herramienta convierte las interfaces web en texto estructurado, permitiendo a los modelos de lenguaje interactuar con los sitios de manera más predecible. Este enfoque permite una interacción más precisa con los elementos de la interfaz de usuario (botones, formularios, menús) al tiempo que garantiza una ejecución más rápida y económica que las soluciones basadas en el análisis de imágenes.
A diferencia de la mayoría de sus competidores, Brower Use Cloud se puede utilizar con diferentes LLMs. Su versión Pro es ofrecida por la startup a 30 $/mes, lo que la convierte en una alternativa de código abierto más flexible y menos costosa que Operator de OpenAI.

Una rápida tracción y casos de uso variados

En solo unos meses, Browser Use ha experimentado un crecimiento espectacular. Su proyecto de código abierto, al que contribuye activamente una comunidad de más de 15,000 desarrolladores, acumula más de 48,400 estrellas en GitHub. Sus herramientas cubren diversos casos de uso, entre los que se incluyen la automatización de inicio de sesión y navegación web, la extracción de datos a gran escala, las pruebas de aseguramiento de calidad o las integraciones CRM.
Con esta recaudación de fondos, Browser Use pretende acelerar el desarrollo de su infraestructura y, con este fin, planea contratar a los mejores ingenieros.
Magnus Müller comenta:
"Creemos firmemente que la interacción entre la IA y la web experimentará una transformación mayor en los próximos años. En unos años, creemos que las interacciones automatizadas por IA superarán a las realizadas por humanos."

Para entender mejor

¿Qué es la tecnología de conversión de interfaces web en texto estructurado y por qué es importante para Browser Use?

La tecnología de conversión de interfaces web en texto estructurado permite que los modelos de lenguaje traten los sitios web como bases de datos textuales, mejorando la precisión y fiabilidad en comparación con los métodos visuales. Esto es crucial para Browser Use ya que reduce la dependencia de la percepción humana y las variaciones visuales, haciendo la automatización más rápida y económica.

¿Cómo influye la recaudación de fondos de Browser Use por parte de varios inversores en sus capacidades de desarrollo e innovación?

La diversidad de inversores de Browser Use, como Felicis Ventures y Y Combinator, ofrece no solo recursos financieros, sino también una red estratégica de consejos y asociaciones. Esto acelera su desarrollo tecnológico e innovación, al tiempo que refuerza su posición en el campo de la automatización web.