Knowledge Base и RAG¶

База знаний позволяет AI отвечать на вопросы клиентов, опираясь на ваши документы: регламенты, FAQ, инструкции.

Как это работает¶

Вы загружаете документы (PDF, DOCX, TXT) в базу знаний.
Schemix разбивает их на фрагменты (chunks) и создаёт векторные представления (embeddings).
Когда клиент задаёт вопрос — система находит релевантные фрагменты через vector search.
AI получает найденные фрагменты как контекст и формирует ответ.

Это называется RAG (Retrieval-Augmented Generation).

Выбор embedding-модели¶

Embedding — векторное представление текста, по которому работает поиск. Модель выбирается при создании каждой базы знаний независимо.

Модель	Особенности
rubert-tiny2 (встроенная)	Бесплатная, не требует API-ключа. Хорошо работает с русским текстом. Подходит для большинства задач
OpenAI (text-embedding-3-small / -large)	Мультиязычная, высокое качество. Требует API-ключ OpenAI
YandexGPT Embeddings	Для клиентов Yandex Cloud. Требует Folder ID и API Key

Если подключён внешний провайдер — его нужно предварительно настроить в разделе Администрирование → AI-провайдеры.

Создание базы знаний¶

Администрирование → Базы знаний → Создать.
Укажите название (например: «FAQ», «Регламенты поддержки»).
Выберите embedding-модель.
Загрузите документы.

Поддерживаемые форматы¶

PDF — извлечение текста из всех страниц
DOCX — документы Microsoft Word
TXT — текстовые файлы

Статусы документов¶

Статус	Описание
pending	Ожидает обработки
processing	Идёт разбивка и индексация
ready	Готов к поиску
error	Ошибка обработки

Прогресс индексации отображается в реальном времени через WebSocket.

Использование в процессе¶

AI Task с RAG¶

В настройках AI Task → секция «RAG» → выберите базу знаний. AI получит релевантные фрагменты как контекст для ответа.

AI Chat с RAG¶

В настройках AI Chat → выберите базу знаний. AI будет автоматически искать в ней при каждом сообщении клиента.

Переиндексация¶

При смене embedding-модели в конкретной базе знаний её документы переиндексируются автоматически. Прогресс отображается на странице базы. Во время переиндексации AI Chat продолжает работать, но RAG-поиск временно недоступен — при необходимости кейс эскалируется на оператора.