Skip to Content
Документы

Документы

ETRL Chat работает с документами в трёх контекстах: вложения в чат, база знаний и страницы. Каждый оптимизирован под свой сценарий.

Форматы

ФорматПоддержкаОбработка
PDFПолнаяUnstructured (текст, таблицы, заголовки), fallback на локальный парсер
DOCXПолнаяUnstructured, сохранение форматирования
PPTXПолнаяUnstructured, извлечение текста слайдов
TXT/MDПолнаяПрямое чтение
CSV/XLSXПолнаяАнализ как таблица
HTMLПолнаяИзвлечение основного контента

Unstructured

PDF/DOCX/PPTX обрабатываются через Unstructured — облачный сервис с лучшим распознаванием структуры (таблицы, заголовки, колонки). Если он недоступен — включается локальный ChunkingLoader (проще, но хуже со сложной структурой).

Вложение vs. База знаний

Вложение в чатБаза знаний
КонтекстТолько этот диалогВсе диалоги
ИндексацияНа летуЗаранее, через RAG
Лучше дляРазовый вопрос по файлуРегулярная работа с документом

Если вы часто обращаетесь к одному документу — добавьте его в базу знаний.

Экспорт

Страницы можно экспортировать в Markdown, HTML, PDF. Чаты — экспортируются целиком через Настройки → Системные инструменты → Экспорт.

Размеры файлов

Лимит одного файла — 50 МБ (документы), 20 МБ (изображения). Общий объём хранилища — 500 МБ (Free), 10 ГБ (Pro). См. Лимиты.

Last updated on