6.1 RAG: обзор, работа с векторными базами данных и продвинутые методы
Ранее мы уже коснулись механизма генерации ответов с расширенным поиском (Retrieval Augmented Generation, RAG). Механизм помогает обогатить общие знания модели в доменной области без необходимости её дообучать — что может быть долго и затратно — благодаря тому, что обращается к векторным мета-документам с актуальной информацией.

RAG включает в себя хранение, поиск дополнительной информации и её интеграцию в контекст модели:
Решение на основе механизма RAG может быть полезно, например, в таких случаях:

  • Нужно создать автоматизированного ассистента для сотрудников, который отвечает на основе внутренней документации компании.
  • Создать юридического консультанта, например, для застройщика, который проверяет свои ответы на соответствие законодательным нормам.
  • Создание других подобных решений, когда модель должна обращаться к специальным знаниям в узких доменах, чтобы сгенерировать предсказуемо корректный ответ.

В этом уроке мы подробнее рассмотрим реализацию механизма RAG: устройство векторных баз данных, поиск по ним и продвинутые методы работы.