TLDR : Google ha annunciato durante il Google I/O 2025 aggiornamenti dei suoi modelli di IA Gemini 2.5, Veo 3 e Imagen 4, oltre all'integrazione di una nuova modalità AI nel motore di ricerca. Tra i miglioramenti, si nota una modalità di ragionamento migliorata per Gemini 2.5, un lancio dell'AI Mode negli Stati Uniti per ricerche più approfondite, e l'evoluzione del Project Starline in Google Beam per conversazioni in 3D più realistiche.
Senza grande sorpresa, l'IA ha dominato gli annunci di Google I/O 2025: aggiornamenti dei modelli Gemini 2.5, Veo 3 e Imagen 4, AI Mode per il motore di ricerca... Google mette l'IA e Gemini al centro dei suoi prodotti.
La famiglia Gemini 2.5
Gemini 2.5 Pro, lanciato a marzo scorso, è ora dotato di una modalità di ragionamento migliorata chiamata
Deep Think. Questa modalità permette al modello di dedicare più cicli di calcolo a compiti complessi, in particolare in matematica o programmazione, ed esplorare diverse ipotesi prima di formulare una risposta.
Gemini 2.5 Flash, svelato ad aprile scorso, è un modello di ragionamento ibrido, che permette agli sviluppatori di attivare o disattivare la riflessione, progettato per offrire un equilibrio ottimale tra costo, prestazioni e latenza.
Google ha annunciato miglioramenti in termini di ragionamento, gestione del codice, elaborazione multimodale e comprensione di contesti estesi oltre a una riduzione del consumo di token del 20-30%, secondo le sue valutazioni interne.
I 2 modelli beneficiano di nuove funzionalità: un'uscita audio nativa via
API per un'esperienza conversazionale più naturale, misure di sicurezza avanzate e le capacità di utilizzo del computer dell'agente IA Project Mariner.
Distribuzione dell'AI Mode
Mentre gli AI Overviews, presentati durante l'edizione I/O 2024, hanno recentemente beneficiato di un aggiornamento,
Google annuncia la distribuzione negli Stati Uniti dell'AI Mode, per le domande che richiedono un'esplorazione approfondita, confronti e un ragionamento sfumato.
Alimentato da un modello Gemini 2.5 ottimizzato, con accesso a fonti e informazioni in tempo reale, AI Mode si basa su una tecnica di "query fan-out" o distribuzione di richieste. L'IA lancia più ricerche simultanee su diversi argomenti legati alla domanda posta, utilizzando diverse fonti di dati, quindi raccoglie i risultati di queste ricerche per fornire una risposta strutturata con collegamenti ipertestuali alle pagine web citate. Gli utenti possono, se lo desiderano, affinare le loro ricerche con richieste di follow-up.
Il Project Starline evolve e diventa Google Beam
Google Beam utilizza tecnologie avanzate, come la visualizzazione a campo luminoso, la cattura volumetrica tramite sei telecamere, l'audio spaziale e l'elaborazione in tempo reale tramite IA, per creare una rappresentazione in 3D dell'interlocutore. Questo approccio permette conversazioni più realistiche, con un rendering a 60 fotogrammi al secondo e una maggiore precisione dei movimenti della testa, senza la necessità di dispositivi portatili come caschi o occhiali. Inizialmente, questa tecnologia era confinata a prototipi voluminosi, ma è stata miniaturizzata per integrarsi in sistemi più compatti, sviluppati in collaborazione con HP.
La funzionalità di traduzione vocale in tempo reale, che
Google ha anche integrato in Meet, permette conversazioni multilingue fluide, mantenendo la voce, il tono e le espressioni dell'utente.
Per capire meglio
Che cos'è il display a campo di luce utilizzato in Google Beam e quali implicazioni potrebbe avere per la realtà virtuale e aumentata?
Il display a campo di luce è una tecnologia che cattura e visualizza la luce in tutte le sue direzioni, consentendo di ricreare un'immagine 3D realistica senza bisogno di occhiali speciali. Questo potrebbe rivoluzionare le applicazioni di realtà virtuale e aumentata offrendo un'esperienza più immersiva e naturale.
Come influisce la tecnica del "query fan-out" di Google AI Mode sulla privacy dei dati degli utenti?
La tecnica "query fan-out" implica l'invio di più query a diverse fonti, il che potrebbe rappresentare sfide per la privacy dei dati a causa dell'aumento dei punti di contatto con dati potenzialmente sensibili. I regolatori potrebbero richiedere audit per garantire la conformità agli standard di privacy.