Компания Google анонсировала двепродвинутые ИИ-модели — Veo 2 для генерации видеороликов, а также Imagen3 для изображений. По словам разработчиков, оба фирменных решения обладают широкими возможностями по созданию качественного мультимедийногоконтента.
Модель Veo 2 умеет создаватьвысокодетализированные 4K-ролики продолжительностью в несколько минут, предлагая пользователю широкий спектр тем истилей. Модель хорошо понимает физику реального мира и движения человека, за счётчего достигается максимальная реалистичность.
ИИ-модель, по заверению Google, превзошла большинствосвоих конкурентов в бенчмарке, выдавая наиболее точные результаты по текстовому запросу с наименьшимколичеством артефактов. Однако, по словам разработчиков, у ИИ по-прежнему естьпроблемы с согласованностью во времени в сложных сценах — это должно быть исправлено в последующих патчах.
Google Imagen 3 создаёт более яркие и реалистичные изображения с улучшенным цветовым балансом и точностью цветопередачи по сравнению с предыдущей версией. Также былирасширены возможности создания изображений в различных стилях (от фотореализмадо абстрактного искусства), а заодно улучшилось понимание подсказок на естественном языке ивизуализация текста.
В качестве меры безопасностивсе изображения и видео помечаются водяным знаком SynthID, который помогает идентифицироватьконтент, созданный искусственным интеллектом.
Модель Veo 2 доступна в Google Labs споследующим расширением на сервис YouTube Shorts. В свою очередь, Imagen 3 развёрнута по всему миру идоступна через .