Google анонсировала модель Gemini 2.0, которая генерирует текст, звук и изображения и поддерживает мультимодальные возможности

Google анонсировала модель Gemini 2.0, которая генерирует текст, звук и изображения и поддерживает мультимодальные возможности. Она закладывает основу для агентского ИИ, который может выполнять задачи от имени пользователей. Например, Project Astra помогает находить объекты, Project Mariner заменяет пользователя при веб-серфинге, а агент Jules помогает разработчикам исправлять ошибки в коде. Кроме того, появилась фича Stream Realtime, которая позволяет демонстрировать экран, включать веб-камеру или общаться через микрофон. Google хочет сделать Gemini единой моделью для всех продуктов, а не разрозненным набором инструментов. Полный релиз Gemini 2.0 ожидается в начале следующего года, а попробовать модель уже можно в её экспериментальной версии.

1 view