3.1. Как составлять промпты для Kandinsky
GigaChat умеет генерировать изображения, так что с ним можно ускорить создание контента без необходимости создавать иллюстрации вручную. За изображения отвечает входящая в его состав модель Kandinsky. Она понимает запросы на русском и английском, знакома с объектами российской и мировой культуры и умеет создавать изображения в разном стиле: фото, рисунки, живопись, аниме, комикс и многие другие.
Чтобы получить изображение, нужно написать промпт. В этом уроке разберём, как писать детализированные промпты, а пока что попросим GigaChat нарисовать художника Кандинского.

Сам художник не работал в такой манере, но модель Kandinsky считает, что он мог изобразить себя вот так («Нарисуй автопортрет Кандинского»):
А так могло бы выглядеть его фото («Создай фото Кандинского»):
Как составлять промпты для генерации изображений

Чтобы GigaChat сгенерировал изображение, начинайте промпт со слов «Нарисуй», «Создай изображение», «Сделай картинку» — или аналогичных по смыслу.

Шаг 1. Определяем объект

Как и в генерации текстов, на запрос без конкретики, вроде «нарисуй обложку для презентации», нейросеть скорее даст расплывчатый результат:
Задайте предмет, который должен быть на картинке: Кандинский, корабль, профессор, кот, группа друзей, яблоко, Чебурашка, единорог, торт и т. д.
Шаг 2. Добавляем описание и действие

Опишите сцену. Укажите, что происходит с предметом в пространстве, положение относительно других предметов, что он делает. Добавьте описание внешнего вида объекта, его размера и формы. Используйте простые формулировки, конкретные слова, избегая абстрактных прилагательных, причастных и деепричастных оборотов.
Шаг 3. Добавляем описания фона и переднего плана

Если вам важны детали, уточните локацию, композицию, что должно находиться на переднем и заднем плане изображения: «на горизонте встаёт солнце», «на переднем плане чашка кофе», «на фоне видны другие люди».
Шаг 4. Описываем дополнительные детали сцены

Добавьте описание освещения и цветовую гамму изображения, например, «тёплый свет», «вечерний свет», «мерцающие огни», «снежинки».
Шаг 5. Выбираем стиль изображения

Нейросеть знает разные стили и направления в визуальном искусстве. Это может быть фото портрет, 4K, акварельный рисунок, живопись, манера определённого художника, киберпанк, хохлома, аниме, комикс и многое другое. Экспериментируйте и не забывайте оценивать результаты с помощью лайков и дизлайков, это помогает нейросети учиться.
GigaChat помнит контекст беседы и может нарисовать то, что вы обсуждали ранее в диалоге. Впрочем, длинный контекст может его запутать, так что для картинок на новые темы рекомендуем открывать новый диалог.

Можно писать промпты и на английском: модель училась на большом объёме англоязычных данных и хорошо его понимает.

Запомним составные части хорошего промпта:
Ещё несколько примеров напоследок: