Google I/O 2025: ШІ у центрі технологічної екосистеми

Google I/O 2025: ШІ у центрі технологічної екосистеми

У короткому : Google анонсував під час Google I/O 2025 оновлення своїх моделей ШІ Gemini 2.5, Veo 3 та Imagen 4, а також інтеграцію нового режиму AI у пошуковий двигун. Серед покращень відзначають покращений режим міркування для Gemini 2.5, розгортання AI Mode у США для більш детальних досліджень та еволюцію Project Starline у Google Beam для більш реалістичних 3D-розмов.

Без великого сюрпризу, ШІ домінував у анонсах Google I/O 2025: оновлення моделей Gemini 2.5, Veo 3 та Imagen 4, AI Mode для пошукового двигуна... Google ставить ШІ та Gemini в центр своїх продуктів.

Сімейство Gemini 2.5

Gemini 2.5 Pro, запущений у березні минулого року, тепер обладнаний поліпшеним режимом міркування під назвою Deep Think. Цей режим дозволяє моделі присвячувати більше обчислювальних циклів складним завданням, зокрема в математиці або програмуванні, і досліджувати кілька гіпотез перед формулюванням відповіді.
Gemini 2.5 Flash, представлений у квітні минулого року, є моделлю гібридного міркування, яка дозволяє розробникам вмикати або вимикати рефлексію, розроблену для оптимального балансу між вартістю, продуктивністю та затримкою. Google оголосив про поліпшення в сфері міркування, управління кодом, мультимодальної обробки та розуміння розширених контекстів, а також зниження споживання токенів на 20 до 30 % відповідно до своїх внутрішніх оцінок.
Обидві моделі отримали нові функціональні можливості: рідний аудіо вихід через API для більш природного розмовного досвіду, розширені заходи безпеки та можливості використання комп'ютера агентом ШІ Project Mariner.

Розгортання AI Mode

Хоча AI Overviews, представлені на I/O 2024, недавно отримали оновлення, Google оголошує про розгортання AI Mode у США для питань, що потребують поглибленого дослідження, порівнянь та нюансованого міркування.
Забезпечений оптимізованою моделлю Gemini 2.5 з доступом до джерел і інформації в реальному часі, AI Mode базується на техніці "query fan-out" або розподілу запитів. ШІ запускає кілька пошуків одночасно щодо різних тем, пов'язаних із заданим питанням, використовуючи різні джерела даних, а потім збирає результати цих пошуків для надання структурованої відповіді з гіперпосиланнями на цитовані веб-сторінки. Користувачі, якщо бажають, можуть уточнити свої пошуки за допомогою наступних запитів.

Project Starline еволюціонує та стає Google Beam

Google Beam використовує передові технології, такі як відображення світлового поля, об'ємне захоплення за допомогою шести камер, просторове аудіо та обробка в реальному часі за допомогою ШІ, щоб створити 3D-представлення співрозмовника. Цей підхід дозволяє більш реалістичні розмови з відображенням 60 кадрів в секунду та підвищеною точністю рухів голови без необхідності у носимих пристроях, як шоломи або окуляри. Спочатку ця технологія була обмежена громіздкими прототипами, але її було мініатюризовано для інтеграції у компактніші системи, розроблені у партнерстві з HP.
Функція перекладу голосу в реальному часі, яку Google також інтегрував у Meet, дозволяє проводити багатомовні розмови безперебійно, зберігаючи голос, тон та вирази користувача.

Краще зрозуміти

Що таке дисплей світлового поля, який використовується в Google Beam, і які наслідки це може мати для віртуальної та доповненої реальності?

Дисплей світлового поля — це технологія, яка захоплює і відображає світло у всіх його напрямках, дозволяючи створити реалістичне 3D-зображення без спеціальних окулярів. Це може революціонізувати застосування віртуальної та доповненої реальності, надаючи більш захоплюючий і природний досвід.

Як техніка 'query fan-out' у режимі AI від Google впливає на конфіденційність даних користувача?

Техніка 'query fan-out' передбачає надсилання багатьох запитів до різних джерел, що може викликати проблеми з конфіденційністю даних через збільшену кількість контактів з потенційно конфіденційними даними. Регулятори можуть вимагати аудити для забезпечення дотримання стандартів конфіденційності.