Google I/O 2025 : L’IA au cœur de l'écosystème technologique

En bref : Google a annoncé lors du Google I/O 2025 des mises à jour de ses modèles d'IA Gemini 2.5, Veo 3 et Imagen 4, ainsi que l'intégration d'un nouveau mode AI au moteur de recherche. Parmi les améliorations, on note un mode de raisonnement amélioré pour Gemini 2.5, un déploiement de l'AI Mode aux États-Unis pour des recherches plus approfondies, et l'évolution du Project Starline en Google Beam pour des conversations en 3D plus réalistes.

Sans grande surprise, l'IA a dominé les annonces de Google I/O 2025 : mises à jour des modèles Gemini 2.5, Veo 3 et Imagen 4, AI Mode pour le moteur de recherche... Google place l'IA et Gemini au cœur de ses produits.

La famille Gemini 2.5

Gemini 2.5 Pro, lancé en mars dernier, est désormais doté d'un mode de raisonnement amélioré appelé Deep Think. Ce mode permet au modèle de consacrer davantage de cycles de calcul à des tâches complexes, notamment en mathématiques ou en programmation et d'explorer plusieurs hypothèses avant de formuler une réponse.

Gemini 2.5 Flash, dévoilé en avril dernier, est un modèle de raisonnement hybride, qui permet aux développeurs d’activer ou de désactiver la réflexion, conçu pour offrir un équilibre optimal entre coût, performance et latence. Google a annoncé des améliorations en matière de raisonnement, de gestion du code, de traitement multimodal et de compréhension de contextes étendus ainsi qu'une réduction de la consommation de jetons de 20 à 30 %, selon ses évaluations internes.

Les 2 modèles bénéficient de nouvelles fonctionnalités : une sortie audio native via une API pour une expérience conversationnelle plus naturelle, des mesures de sécurité avancées et les capacités d’utilisation de l’ordinateur de l'agent IA Project Mariner.

Déploiement de l'AI Mode

Alors que les AI Overviews, présentés lors de l'édition I/O 2024, ont bénéficié récemment d’une mise à niveau, Google annonce le déploiement aux Etats-Unis de l'AI Mode, pour les questions nécessitant une exploration approfondie, des comparaisons et un raisonnement nuancé.

Alimenté par un modèle Gemini 2.5 optimisé, avec un accès à des sources et des informations en temps réel, AI Mode s'appuie sur une technique de “query fan-out” ou distribution de requêtes. L'IA lance plusieurs recherches simultanées sur différents sujets liés à la question posée, en utilisant diverses sources de données, puis rassemble les résultats de ces recherches pour fournir une réponse structurée avec des liens hypertextes vers les pages web citées. Les internautes peuvent s'ils le désirent affiner leurs recherches avec des requêtes de suivi.

Le Project Starline évolue et devient Google Beam

Google Beam utilise des technologies avancées, telles que l'affichage à champ lumineux, la capture volumétrique via six caméras, l'audio spatial et le traitement en temps réel par l'IA, pour créer une représentation en 3D de l'interlocuteur. Cette approche permet des conversations plus réalistes, avec un rendu à 60 images par seconde et une précision accrue des mouvements de tête, sans nécessiter de dispositifs portables comme des casques ou des lunettes. Initialement, cette technologie était confinée à des prototypes volumineux, mais elle a été miniaturisée pour s'intégrer dans des systèmes plus compacts, développés en partenariat avec HP.

La fonctionnalité de traduction vocale en temps réel, que Google a également intégrée à Meet, permet des conversations multilingues fluides, en conservant la voix, le ton et les expressions de l'utilisateur.

Pour mieux comprendre (assisté par l'IA)

Qu'est-ce que l'affichage à champ lumineux, utilisé dans Google Beam, et quelles implications pourrait-il avoir pour la réalité virtuelle et augmentée?

L'affichage à champ lumineux est une technologie qui capture et affiche la lumière dans toutes ses directions, permettant de recréer une image 3D réaliste sans avoir besoin de lunettes spéciales. Cela pourrait révolutionner les applications de réalité virtuelle et augmentée en offrant une expérience plus immersive et naturelle.

Comment la technique de "query fan-out" employée par le AI Mode de Google impacte-t-elle la confidentialité des données utilisateur?

La technique de "query fan-out" implique l'envoi de multiples requêtes à différentes sources, ce qui pourrait poser des défis en matière de confidentialité des données en raison de l'augmentation des points de contact avec des données potentiellement sensibles. Les régulateurs pourraient exiger des audits pour garantir la conformité aux normes de confidentialité.

Tendances

Comprendre l'IA

Applications de l'IA