Google DeepMind представил новые ИИ-генераторы видео и изображений

DeepMind — ориентированное на ИИ подразделение Google — анонсировало новую модель для генерации видео Veo 2. 

Нейросеть способна:

  • создавать видео с разрешением до 4K;
  • понимать требования к управлению камерой в промптах;
  • хорошо воссоздавать правила физического мира и реалистичное выражение лиц человека.

«При прямых сравнениях результатов, проведенных экспертами, Veo 2 отдали предпочтение по сравнению с другими передовыми моделями генерации видео», — отметили DeepMind.

В экспериментальном инструменте Google VideoFX для создания видео на данный момент доступны ролики с разрешением до 720p и продолжительностью до восьми секунд. Полный функционал Veo 2 предоставлен лишь ограниченному числу пользователей, а расширенный запуск планируется на следующий год.

Сотрудники Google также улучшили возможности генератора изображений Imagen 3. Нейросеть получила способность применять различные стили искусства вроде реализма, фэнтези и других. 

Также она точнее создает картинку по промпту и генерирует более яркие и сбалансированные визуальные эффекты. 

Напомним, в декабре Google выпустила новую модель Gemini 2.0, инструмент Deep Research для рассуждений и ИИ-агента Project Mariner — он способен выполнять действия на компьютере вместо пользователя. 

Читайте на 123ru.net