Перейти к содержанию

Knowledge Base и RAG

База знаний позволяет AI отвечать на вопросы клиентов, опираясь на ваши документы: регламенты, FAQ, инструкции.

Как это работает

  1. Вы загружаете документы (PDF, DOCX, TXT) в базу знаний.
  2. Schemix разбивает их на фрагменты (chunks) и создаёт векторные представления (embeddings).
  3. Когда клиент задаёт вопрос — система находит релевантные фрагменты через vector search.
  4. AI получает найденные фрагменты как контекст и формирует ответ.

Это называется RAG (Retrieval-Augmented Generation).

Выбор embedding-модели

Embedding — векторное представление текста, по которому работает поиск. Модель выбирается при создании каждой базы знаний независимо.

Модель Особенности
rubert-tiny2 (встроенная) Бесплатная, не требует API-ключа. Хорошо работает с русским текстом. Подходит для большинства задач
OpenAI (text-embedding-3-small / -large) Мультиязычная, высокое качество. Требует API-ключ OpenAI
YandexGPT Embeddings Для клиентов Yandex Cloud. Требует Folder ID и API Key

Если подключён внешний провайдер — его нужно предварительно настроить в разделе Администрирование → AI-провайдеры.

Создание базы знаний

  1. Администрирование → Базы знаний → Создать.
  2. Укажите название (например: «FAQ», «Регламенты поддержки»).
  3. Выберите embedding-модель.
  4. Загрузите документы.

Поддерживаемые форматы

  • PDF — извлечение текста из всех страниц
  • DOCX — документы Microsoft Word
  • TXT — текстовые файлы

Статусы документов

Статус Описание
pending Ожидает обработки
processing Идёт разбивка и индексация
ready Готов к поиску
error Ошибка обработки

Прогресс индексации отображается в реальном времени через WebSocket.

Использование в процессе

AI Task с RAG

В настройках AI Task → секция «RAG» → выберите базу знаний. AI получит релевантные фрагменты как контекст для ответа.

AI Chat с RAG

В настройках AI Chat → выберите базу знаний. AI будет автоматически искать в ней при каждом сообщении клиента.

Переиндексация

При смене embedding-модели в конкретной базе знаний её документы переиндексируются автоматически. Прогресс отображается на странице базы. Во время переиндексации AI Chat продолжает работать, но RAG-поиск временно недоступен — при необходимости кейс эскалируется на оператора.