Система RAG Базы Знаний - Интеллектуальная Интеграция Чатбота
Вопросы и Ответы на основе RAG с Интеграцией Документов, FAQ и Новостей
Описание Проекта
Этот проект реализует комплексную систему базы знаний, используя технологию Retrieval-Augmented Generation (RAG) для интеллектуальных вопросов и ответов в чатботе. Система интегрирует документы, FAQ и новостные статьи для предоставления контекстных ответов с использованием OpenAI GPT-4o-mini. Она включает векторный поиск для схожести документов, формат TOON для эффективного форматирования контекста, автоматическое хранение вопросов без ответов и бесшовную интеграцию с системой управления документами. Чатбот приоритизирует совпадения FAQ, затем использует базу знаний для подробных ответов и обращается к новостным статьям как к дополнительному источнику информации.
Основные Функции
Генерация Ответов на основе RAG
OpenAI GPT-4o-mini со структурированными ответами JSON
Векторный Поиск
Поиск схожести документов на основе embeddings
Интеграция Документов
Автоматическая индексация и векторизация документов
Интеграция FAQ
Поиск FAQ на основе ключевых слов с оценкой
Интеграция Новостей
Поиск новостных статей как резервный источник информации
Управление Вопросами
Автоматическое хранение и управление вопросами без ответов
Технологический Стек
Backend-Фреймворк
ИИ & МО
Frontend
Управление Данными
Рабочий Процесс
- Запрос Пользователя: Пользователь задает вопрос в чатботе
- Поиск FAQ: Система ищет в файлах FAQ с сопоставлением ключевых слов и оценкой
- Поиск Базы Знаний: Если оценка FAQ низкая, система ищет в векторизованных документах
- Форматирование Контекста: Результаты поиска форматируются как TOON (Token-Oriented Object Notation)
- Генерация Ответов: OpenAI GPT-4o-mini генерирует ответ на основе контекста со схемой JSON
- Отображение Источников: Релевантные источники документов отображаются с информацией о фрагментах
- Хранение Вопросов: Если ответ не найден, вопрос автоматически сохраняется для проверки
- Резерв Новостей: Если нет совпадения документа, система ищет в новостных статьях