Skip to Content
База знаний и RAG

База знаний и RAG

База знаний — ваше персональное хранилище документов, по которому агент может искать информацию через RAG (Retrieval-Augmented Generation).

Как работает RAG

  1. Вы загружаете документы в базу знаний.
  2. Документы разбиваются на фрагменты и индексируются (эмбеддинги).
  3. При запросе агент ищет релевантные фрагменты.
  4. Найденное подаётся в контекст модели.
  5. Модель формирует ответ со ссылкой на источник.

Это позволяет агенту отвечать по большим документам, не переплачивая за токены (подаются только релевантные фрагменты, а не весь документ целиком).

Создание базы знаний

  1. База знаний → Создать.
  2. Назовите базу (например, «Проект X», «Договоры 2026»).
  3. Загрузите файлы (PDF, DOCX, PPTX, TXT, MD).
  4. Дождитесь индексации (зависит от размера; обычно минуты).

Привязка к чату

  • К конкретному диалогу — кнопка «База знаний» в панели ввода, выберите базу. Она будет использоваться только в этом диалоге.
  • К агенту — в настройках агента задайте базу знаний по умолчанию. Все диалоги с этим агентом будут её использовать.

Эмбеддинги — бесплатны

Векторные эмбеддинги (text-embedding-3-small) бесплатны для пользователя. ETRL покрывает их себестоимость. Лимит — только общий объём хранилища.

Фрагментация и качество

Качество RAG зависит от того, как документы разбиты. PDF/DOCX/PPTX обрабатываются через Unstructured (лучшее распознавание таблиц и заголовков). Если результаты слабые — проверьте структуру исходного документа (заголовки, секции помогают).

Last updated on