Google представила генеративный ИИ для создания видео и картинок по текстовым запросам
Сегодня, 14 мая, в рамках презентации Google I/O представители компании Google представили сразу два движка на базе искусственного интеллекта, которые, вероятно, отнимут ещё немного рабочих мест у творческих людей в будущем. Например, сервис Veo предоставляет возможность генерировать высококачественные видеоролики в формате 1080р, создавая конкуренцию Sora от OpenAI. В Google даже заявили, что их новинка обладает более передовым пониманием визуальной семантики, плюс система умеет моделировать физику реального мира — для рендеринга воды, к примеру. Также данный инструмент позволяет генерировать видео длительностью свыше минуты, он умеет имитировать кинематографические и визуальные эффекты вроде таймлапса и многое другое.
Также поисковой гигант представил Imagen 3 — это большая языковая модель, которая, по мнению Google, является самой качественной моделью преобразования текста в изображение. Разработчики сервиса обещают высокий уровень детализации, фотореалистичные изображения и минимальное количество артефактов у конечного контента. В компании отдельное внимание уделили пониманию и обработке деталей в длинных подсказках, но будет ли этот инструмент на самом деле лучше потенциальных конкурентов — вопрос открытый. Вероятно, сначала нужно будет провести ряд тестов, чтобы сравнить генерацию изображений с лидерами рынка, но приятно, что Google работает в этом направлении.