Google I/O 2025: KI im Zentrum des technologischen Ökosystems

Google I/O 2025: KI im Zentrum des technologischen Ökosystems

TLDR : Google hat bei der Google I/O 2025 Updates für seine KI-Modelle Gemini 2.5, Veo 3 und Imagen 4 angekündigt, sowie die Integration eines neuen AI Mode in die Suchmaschine. Zu den Verbesserungen gehören ein verbesserter Denkmodus für Gemini 2.5, der Einsatz des AI Mode in den USA für tiefere Recherchen und die Entwicklung des Project Starline zu Google Beam für realistischere 3D-Gespräche.

Ohne große Überraschung dominierte KI die Ankündigungen von Google I/O 2025: Updates der Modelle Gemini 2.5, Veo 3 und Imagen 4, AI Mode für die Suchmaschine... Google stellt KI und Gemini ins Zentrum seiner Produkte.

Die Gemini 2.5 Familie

Gemini 2.5 Pro, im März letzten Jahres eingeführt, verfügt jetzt über einen verbesserten Denkmodus namens Deep Think. Dieser Modus erlaubt dem Modell, mehr Rechenzyklen komplexen Aufgaben zu widmen, insbesondere in Mathematik oder Programmierung, und mehrere Hypothesen zu erkunden, bevor eine Antwort formuliert wird.
Gemini 2.5 Flash, im April letzten Jahres enthüllt, ist ein hybrides Denkmodell, das Entwicklern ermöglicht, das Denken zu aktivieren oder zu deaktivieren, konzipiert, um ein optimales Gleichgewicht zwischen Kosten, Leistung und Latenz zu bieten. Google hat Verbesserungen im Bereich Denken, Codeverwaltung, multimodale Verarbeitung und Verstehen von erweiterten Kontexten angekündigt sowie eine Reduzierung des Tokenverbrauchs um 20 bis 30 %, laut internen Bewertungen.
Die 2 Modelle profitieren von neuen Funktionen: einer nativen Audioausgabe über eine API für ein natürlicheres Konversationserlebnis, erweiterten Sicherheitsmaßnahmen und den Fähigkeiten der Computerverwendung des KI-Agenten Project Mariner.

Einsatz des AI Mode

Während die AI Overviews, die bei der I/O 2024 vorgestellt wurden, kürzlich ein Upgrade erhielten, kündigt Google den Einsatz des AI Mode in den USA an, für Fragen, die eine tiefere Erforschung, Vergleiche und nuanciertes Denken erfordern.
Angetrieben von einem optimierten Gemini 2.5 Modell, mit Zugriff auf Echtzeitquellen und Informationen, basiert der AI Mode auf einer Technik namens „query fan-out“ oder Anfrageverteilung. Die KI startet mehrere gleichzeitige Suchen zu verschiedenen Themen, die mit der gestellten Frage verbunden sind, indem sie verschiedene Datenquellen verwendet, und sammelt dann die Ergebnisse dieser Suchen, um eine strukturierte Antwort mit Hyperlinks zu den zitierten Webseiten zu liefern. Die Nutzer können, wenn sie möchten, ihre Suchen mit Folgeanfragen verfeinern.

Das Project Starline entwickelt sich zu Google Beam

Google Beam nutzt fortschrittliche Technologien wie Lichtfeldanzeige, volumetrische Erfassung über sechs Kameras, räumliches Audio und Echtzeitverarbeitung durch KI, um eine 3D-Darstellung des Gesprächspartners zu erstellen. Dieser Ansatz ermöglicht realistischere Gespräche, mit einer Wiedergabe von 60 Bildern pro Sekunde und erhöhter Präzision der Kopfbewegungen, ohne tragbare Geräte wie Helme oder Brillen zu benötigen. Ursprünglich war diese Technologie auf sperrige Prototypen beschränkt, wurde aber miniaturisiert, um in kompaktere Systeme integriert zu werden, die in Zusammenarbeit mit HP entwickelt wurden.
Die Funktion der Echtzeit-Sprachübersetzung, die Google auch in Meet integriert hat, ermöglicht flüssige mehrsprachige Gespräche, wobei die Stimme, der Ton und die Ausdrücke des Benutzers erhalten bleiben.

Besser verstehen

Was ist das Lichtfeld-Display, das in Google Beam verwendet wird, und welche Auswirkungen könnte es auf die virtuelle und erweiterte Realität haben?

Das Lichtfeld-Display ist eine Technologie, die Licht in alle Richtungen einfängt und anzeigt, wodurch ein realistisches 3D-Bild ohne spezielle Brillen ermöglicht wird. Dies könnte die Anwendungen für virtuelle und erweiterte Realität revolutionieren, indem es ein immersiveres und natürlicheres Erlebnis bietet.

Wie wirkt sich die 'Query Fan-Out'-Technik von Googles AI Mode auf den Datenschutz aus?

Die 'Query Fan-Out'-Technik beinhaltet das Senden mehrerer Anfragen an verschiedene Quellen, was aufgrund der erhöhten Berührungspunkte mit potenziell sensiblen Daten Datenschutzprobleme darstellen könnte. Regulierungsbehörden könnten Audits verlangen, um die Einhaltung der Datenschutzstandards sicherzustellen.