База знаний и RAG
База знаний — ваше персональное хранилище документов, по которому агент может искать информацию через RAG (Retrieval-Augmented Generation).
Как работает RAG
- Вы загружаете документы в базу знаний.
- Документы разбиваются на фрагменты и индексируются (эмбеддинги).
- При запросе агент ищет релевантные фрагменты.
- Найденное подаётся в контекст модели.
- Модель формирует ответ со ссылкой на источник.
Это позволяет агенту отвечать по большим документам, не переплачивая за токены (подаются только релевантные фрагменты, а не весь документ целиком).
Создание базы знаний
- База знаний → Создать.
- Назовите базу (например, «Проект X», «Договоры 2026»).
- Загрузите файлы (PDF, DOCX, PPTX, TXT, MD).
- Дождитесь индексации (зависит от размера; обычно минуты).
Привязка к чату
- К конкретному диалогу — кнопка «База знаний» в панели ввода, выберите базу. Она будет использоваться только в этом диалоге.
- К агенту — в настройках агента задайте базу знаний по умолчанию. Все диалоги с этим агентом будут её использовать.
Эмбеддинги — бесплатны
Векторные эмбеддинги (text-embedding-3-small) бесплатны для пользователя. ETRL покрывает их себестоимость. Лимит — только общий объём хранилища.
Фрагментация и качество
Качество RAG зависит от того, как документы разбиты. PDF/DOCX/PPTX обрабатываются через Unstructured (лучшее распознавание таблиц и заголовков). Если результаты слабые — проверьте структуру исходного документа (заголовки, секции помогают).
Last updated on