Её уже можно опробовать — бесплатно и без регистрации.
Дарья Громова
Stability AI анонсировала запуск Stable Diffusion XL 1.0 — своей самой продвинутой модели преобразования текста в изображения. По словам создателей, она предлагает более яркие и точные цвета и работает с контрастом, тенями и освещением лучше предыдущих версий.
Генерация в версии 1.0 стала значительно быстрее: сообщается, что картинка в разрешении 1 Мп теперь создаётся за секунды. Улучшили и генерацию текста: в то время как большинство моделей преобразования текста в изображение не могут создавать реалистичные надписи и логотопы, Stable Diffusion XL 1.0 способна на «продвинутую генерацию текста».
Помимо этого новая версия предлагает закрашивание (дорисовку недостающих частей изображения), дорисовку (расширение существующей картинки) и работу с преобразованием картинки в картинку. Последнее работает примерно как генеративная заливка в Photoshop: пользователь выбирает картинку и описывает, какие изменения хочет видеть на выходе.
Ещё одно важное нововведение — нейросеть начала понимать сложные инструкции в виде коротких запросов, тогда как предыдущей версии требовались большие и конкретные описания.
Новая версия Stable Diffusion XL уже доступна на двух платформах, принадлежащих Stability AI: Clipdrop и DreamStudio. На обеих нейросеть можно опробовать бесплатно, но генерация картинка-картинка доступна только через DreamStudio. Есть и недостатки: на готовой иллюстрации будет водяной знак, а очередь на генерацию может составлять тысячи изображений (справедливости ради, во время тестирования очередь из 1200 изображений заняла меньше двух минут). Без регистрации можно сделать лишь несколько запросов, далее придётся создать аккаунт или ждать 24 часа для обновления попыток.
Также Stability AI объявила о новом партнёрстве с Amazon. Благодаря этому Stable Diffusion XL 1.0 выйдет на Amazon Bedrock — облачной платформе для генеративных ИИ-моделей.
Обложка: Лайфхакер