За сутки с момента выхода новой версии нейросети Сбера Kandinsky 2.2 пользователи сгенерировали 1 000 000 уникальных изображений. Самыми популярными темами стали: «коты», «море» и «аниме».
В Kandinsky 2.2 пользователи могут создавать фотореалистичные изображения высокого разрешения — разница с предыдущей версией особенно хорошо видна на портретах. И если раньше картинки были только квадратными, то сейчас появилась возможность задавать соотношение сторон при генерации. Нейросеть также научилась создавать уникальные стикеры, из которых можно собрать стикерпаки в Telegram. А бот Kandinsky 2.2 в этом мессенджере, благодаря архитектуре ControlNet, быстро изменит по текстовому описанию отдельные объекты или элементы на загруженном изображении — и при этом сохранит композицию исходной иллюстрации.
Kandinsky 2.2 умеет также создавать иллюстрацию из нескольких изображений, стилизовать рисунок по текстовому описанию, генерировать картинки, похожие на заданные, дорисовывать недостающие части (inpainting), делать рисунки в режиме бесконечного полотна (outpainting). Нейросеть Сбера, в отличие от иностранных аналогов, понимает запросы на русском языке. Умеет создавать изображения более чем в 20 стилях.
Kandinsky 2.2 можно протестировать на промостранице модели, на платформе FusionBrain.AI, в Telegram-боте и боте ВКонтакте, а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют. Он доступен и на платформе ML Space.
Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.