Whisk от Google — этот ИИ для генерации изображений не требует текстовых подсказок

17.12.2024

Теперь вместо текста можно использовать изображения для создания новых картинок, а инструмент подскажет стиль, сцену и детали.

Google представила новый инструмент под названием Whisk, который позволяет генерировать изображения на основе других изображений. Вместо традиционных текстовых подсказок пользователи могут загружать картинки, указывая тему, сцену и стиль будущего изображения. Если своих картинок нет, можно воспользоваться случайным набором, который предложит сам Google. Дополнительно можно добавить текстовое описание, но это необязательно.

После обработки Whisk создаёт несколько вариантов изображений вместе с текстовыми подсказками, которые можно редактировать. Неудачные результаты можно улучшить, изменив текстовые инструкции или добавив новые детали. Google подчёркивает, что инструмент создан для быстрого визуального поиска идей, а не для точного редактирования изображений.

Whisk работает на основе новой версии модели Imagen 3, представленной Google в тот же день. Imagen 3, по словам компании, генерирует более качественные и детализированные изображения. Также была анонсирована Veo 2 — улучшенная модель генерации видео, которая умеет «читать язык кинематографии» и реже допускает ошибки, такие как странные тени или дополнительные пальцы.

Veo 2 уже доступна в экспериментальном инструменте VideoFX, но пока лишь по приглашениям из Google Labs. В следующем году модель планируют интегрировать в другие сервисы, включая YouTube Shorts. Google активно развивает свои ИИ-инструменты для творчества, делая их более гибкими и доступными для широкой аудитории.

Теги: