Б3.2 Методы Zero-shot и Few-shot в системном промптинге

3.2 Методы Zero-shot и Few-shot в системном промптинге

Изучая, как писать промпты в веб-версии GigaChat, мы уже рассматривали методы zero-shot и few-shot.

Вспомним главное: zero-shot промпт — это запрос, не содержащий подсказку правильного ответа. На него GigaChat ответит, используя только данные, на которых его учили. Если мы зададим ему ряд запросов одного типа, в каждом случае его ответы могут варьироваться по форме и содержанию.

Few-shot промпт — это запрос, содержащий один или несколько подсказок. На него модель ответит, используя свои знания + заданный пример. Ответы модели на ряд запросов одного типа будут формализованными и структурированными, а значит, более предсказуемыми.

Сравним два ответа GiagaChat. В первом системном промпте мы чётко формулируем задачу и не предоставляем никаких примеров:

Хотя входной текст содержит орфографические ошибки, грамматически он написан верно. Видимо, поэтому GigaChat даёт неправильный ответ.

Во втором случае даём GigaChat образцы правильных ответов. Тестируем промпт — и GigaChat отвечает правильно:

С помощью метода few-shot можно добиться более точных ответов. Корректно написанный системный промпт позволяет решать более сложные задачи без дообучения модели.

Резюмируем:

В решениях для бизнеса применяется только системный промптинг – тонкие настройки ответов GigaChat для конкретных задач.
Хороший системный промпт включает: назначение роли для модели, постановку задачи и написание инструкции (если задача включает несколько действий), дополнительный контекст и форматирование ответа (указание языка, тона, стиля, синтаксиса).
Для решения простых задач модели может хватать знаний уровня L1 и L2, так что, чтобы дать достаточный ответ, ей не нужны образцы правильных ответов. Если задача сложнее, рекомендуем показать GigaChat один или несколько подсказок, тогда модель даст более предсказуемый ответ.

Назад К следующему шагу