Б6.1 RAG: обзор, работа с векторными базами данных и продвинутые методы

6.1 RAG: обзор, работа с векторными базами данных и продвинутые методы

Ранее мы уже коснулись механизма генерации ответов с расширенным поиском (Retrieval Augmented Generation, RAG). Механизм помогает обогатить общие знания модели в доменной области без необходимости её дообучать — что может быть долго и затратно — благодаря тому, что обращается к векторным мета-документам с актуальной информацией.

RAG включает в себя хранение, поиск дополнительной информации и её интеграцию в контекст модели:

Решение на основе механизма RAG может быть полезно, например, в таких случаях:

Нужно создать автоматизированного ассистента для сотрудников, который отвечает на основе внутренней документации компании.
Создать юридического консультанта, например, для застройщика, который проверяет свои ответы на соответствие законодательным нормам.
Создание других подобных решений, когда модель должна обращаться к специальным знаниям в узких доменах, чтобы сгенерировать предсказуемо корректный ответ.

В этом уроке мы подробнее рассмотрим реализацию механизма RAG: устройство векторных баз данных, поиск по ним и продвинутые методы работы.

Назад К следующему шагу