Browser Use, una start-up americana che mira a trasformare il modo in cui gli agenti IA interagiscono con il web, ha recentemente annunciato una raccolta fondi di 17 milioni di dollari come parte di un round di finanziamento seed guidato da Felicis Ventures, con la partecipazione di A Capital, Nexus Ventures, Y Combinator, Paul Graham, Liquid2, SV Angel e Pioneer Fund. Costruire l’interfaccia tra i LLM e il web
Browser Use è nata nel 2024 grazie all'iniziativa di Magnus Müller e Gregor Žunič, due ex studenti di scienze dei dati dell'ETH Zurich. Il loro progetto è nato da un semplice esperimento di fine settimana volto a testare se i modelli di linguaggio (LLM) potessero navigare sul web come esseri umani. In soli quattro giorni, hanno sviluppato un prototipo iniziale che è stato poi lanciato sulla piattaforma Hacker News. L'entusiasmo è stato immediato, confermando la loro intuizione che il futuro dell'automazione web guidata dall'IA era più vicino di quanto molti pensassero. Poche settimane dopo, la prima demo era pronta.
I due cofondatori affermano:
"Internet è la più grande fonte di dati non strutturati al mondo, ma interagire con esso richiede ancora azioni umane: cliccare su pulsanti, compilare moduli, navigare manualmente sui siti web. Con l'ascesa dei LLM e degli agenti autonomi, questa realtà sta cambiando. Stiamo costruendo l'infrastruttura che permette all'IA di interagire con il web in modo naturale come un essere umano."
La maggior parte delle soluzioni di automazione esistenti si basa su metodi basati sulla visione, cercando di imitare la percezione umana delle pagine web. Sensibili alle variazioni visive (cambiamento di colore, posizione degli elementi...), per i due uomini sono "lente, costose e poco affidabili". Hanno quindi adottato una strategia radicalmente diversa: il loro strumento converte le interfacce web in testo strutturato, permettendo ai modelli di linguaggio di interagire con i siti in modo più prevedibile. Questo approccio consente un'interazione più precisa con gli elementi dell'interfaccia utente (pulsanti, moduli, menu) garantendo al contempo un'esecuzione più rapida ed economica rispetto alle soluzioni basate sull'analisi delle immagini.
Contrariamente alla maggior parte dei suoi concorrenti,
Browser Use Cloud può essere utilizzato con diversi LLM. La versione Pro è offerta dalla start-up a 30 $/mese, rendendola un'alternativa open source più flessibile e meno costosa di Operator di
OpenAI.
Una rapida trazione e casi d’uso variegati
In soli pochi mesi,
Browser Use ha conosciuto una crescita fulminea. Il suo progetto open source, a cui contribuisce attivamente una comunità di oltre 15.000 sviluppatori, ha accumulato più di 48.400 stelle su GitHub. I suoi strumenti coprono vari casi d'uso, tra cui l'automazione di login e navigazione web, l'estrazione di dati su larga scala, i test di assicurazione qualità o le integrazioni CRM.
Con questa raccolta fondi,
Browser Use intende accelerare lo sviluppo della sua infrastruttura e, a tal fine, prevede di assumere i migliori ingegneri.
Magnus Müller commenta:
"Crediamo fermamente che l'interazione tra l'IA e il web subirà una trasformazione importante negli anni a venire. Tra qualche anno, pensiamo che le interazioni automatizzate dall'IA supereranno quelle effettuate dagli esseri umani."
Per capire meglio
Cos'è la tecnologia di conversione delle interfacce web in testo strutturato e perché è importante per Browser Use?
La tecnologia di conversione delle interfacce web in testo strutturato consente ai modelli linguistici di trattare i siti web come basi di dati testuali, migliorando accuratezza e affidabilità rispetto ai metodi visivi. Questo è cruciale per Browser Use poiché riduce la dipendenza dalla percezione umana e dalle variazioni visive, rendendo l'automazione più veloce ed economica.
Come influisce la raccolta fondi di Browser Use da parte di vari investitori sulle sue capacità di sviluppo e innovazione?
La diversità degli investitori di Browser Use, come Felicis Ventures e Y Combinator, fornisce non solo risorse finanziarie ma anche una rete strategica di consulenze e partnership. Ciò accelera il suo sviluppo tecnologico e innovazione, rafforzando al contempo la sua posizione nel campo dell'automazione web.