Google представила Whisk — новый генератор изображений с функцией «ремикса»

Инструмент позволяет художникам и дизайнерам экспериментировать с десятками вариантов изображений, меняя образы и стили на лету.

Google Labs представил новый экспериментальный инструмент под названием Whisk, который кардинально упрощает процесс создания изображений с помощью генеративного ИИ. В отличие от привычных методов, где для генерации изображений требуется длинное текстовое описание, Whisk позволяет использовать визуальные подсказки. Пользователи могут просто перетащить изображения для объекта, сцены и стиля, чтобы создать уникальные комбинации, будь то эмалевые значки, цифровые иллюстрации или фантастические образы.

Система использует модель Gemini для создания детальных описаний загруженных изображений. Затем эти описания передаются в генеративную модель Imagen 3, которая генерирует новые творения, сохраняя суть выбранных элементов, но интерпретируя их по-своему. Такой подход позволяет микшировать и ремиксировать визуальные идеи, создавая неожиданные и креативные результаты.

Примеры изображений, созданных с помощью Whisk, впечатляют:

Причудливый морж с клубничным узором и цветочной короной. Фантастическая рыба с городом на спине. Глазированный пончик, превращенный в яркий эмалевый значок. Мистическая кошка с рогами, отдыхающая на водной лилии.

Читайте на 123ru.net