Knowledge Base и RAG¶
База знаний позволяет AI отвечать на вопросы клиентов, опираясь на ваши документы: регламенты, FAQ, инструкции.
Как это работает¶
- Вы загружаете документы (PDF, DOCX, TXT) в базу знаний.
- Schemix разбивает их на фрагменты (chunks) и создаёт векторные представления (embeddings).
- Когда клиент задаёт вопрос — система находит релевантные фрагменты через vector search.
- AI получает найденные фрагменты как контекст и формирует ответ.
Это называется RAG (Retrieval-Augmented Generation).
Выбор embedding-модели¶
Embedding — векторное представление текста, по которому работает поиск. Модель выбирается при создании каждой базы знаний независимо.
| Модель | Особенности |
|---|---|
| rubert-tiny2 (встроенная) | Бесплатная, не требует API-ключа. Хорошо работает с русским текстом. Подходит для большинства задач |
| OpenAI (text-embedding-3-small / -large) | Мультиязычная, высокое качество. Требует API-ключ OpenAI |
| YandexGPT Embeddings | Для клиентов Yandex Cloud. Требует Folder ID и API Key |
Если подключён внешний провайдер — его нужно предварительно настроить в разделе Администрирование → AI-провайдеры.
Создание базы знаний¶
- Администрирование → Базы знаний → Создать.
- Укажите название (например: «FAQ», «Регламенты поддержки»).
- Выберите embedding-модель.
- Загрузите документы.
Поддерживаемые форматы¶
- PDF — извлечение текста из всех страниц
- DOCX — документы Microsoft Word
- TXT — текстовые файлы
Статусы документов¶
| Статус | Описание |
|---|---|
| pending | Ожидает обработки |
| processing | Идёт разбивка и индексация |
| ready | Готов к поиску |
| error | Ошибка обработки |
Прогресс индексации отображается в реальном времени через WebSocket.
Использование в процессе¶
AI Task с RAG¶
В настройках AI Task → секция «RAG» → выберите базу знаний. AI получит релевантные фрагменты как контекст для ответа.
AI Chat с RAG¶
В настройках AI Chat → выберите базу знаний. AI будет автоматически искать в ней при каждом сообщении клиента.
Переиндексация¶
При смене embedding-модели в конкретной базе знаний её документы переиндексируются автоматически. Прогресс отображается на странице базы. Во время переиндексации AI Chat продолжает работать, но RAG-поиск временно недоступен — при необходимости кейс эскалируется на оператора.