DeepMind — ориентированное на ИИ подразделение Google — анонсировало новую модель для генерации видео Veo 2.
Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts.
We’re also releasing an improved version of our text-to-image model, Imagen 3 - available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
— Google DeepMind (@GoogleDeepMind) December 16, 2024
Нейросеть способна:
- создавать видео с разрешением до 4K;
- понимать требования к управлению камерой в промптах;
- хорошо воссоздавать правила физического мира и реалистичное выражение лиц человека.
«При прямых сравнениях результатов, проведенных экспертами, Veo 2 отдали предпочтение по сравнению с другими передовыми моделями генерации видео», — отметили DeepMind.
В экспериментальном инструменте Google VideoFX для создания видео на данный момент доступны ролики с разрешением до 720p и продолжительностью до восьми секунд. Полный функционал Veo 2 предоставлен лишь ограниченному числу пользователей, а расширенный запуск планируется на следующий год.
Сотрудники Google также улучшили возможности генератора изображений Imagen 3. Нейросеть получила способность применять различные стили искусства вроде реализма, фэнтези и других.
We’ve also enhanced Imagen 3’s ability to:
Produce diverse art styles: realism, fantasy, portraiture and more
More faithfully turn prompts into accurate images
Generate brighter, more compositionally balanced visuals
→ https://t.co/MmdiHyrugR pic.twitter.com/L1l2Qzs5up
— Google DeepMind (@GoogleDeepMind) December 16, 2024
Также она точнее создает картинку по промпту и генерирует более яркие и сбалансированные визуальные эффекты.
Напомним, в декабре Google выпустила новую модель Gemini 2.0, инструмент Deep Research для рассуждений и ИИ-агента Project Mariner — он способен выполнять действия на компьютере вместо пользователя.