Система RAG Базы Знаний - Интеллектуальная Интеграция Чатбота

Вопросы и Ответы на основе RAG с Интеграцией Документов, FAQ и Новостей

2025-2026 Личный Проект

Описание Проекта

Этот проект реализует комплексную систему базы знаний, используя технологию Retrieval-Augmented Generation (RAG) для интеллектуальных вопросов и ответов в чатботе. Система интегрирует документы, FAQ и новостные статьи для предоставления контекстных ответов с использованием OpenAI GPT-4o-mini. Она включает векторный поиск для схожести документов, формат TOON для эффективного форматирования контекста, автоматическое хранение вопросов без ответов и бесшовную интеграцию с системой управления документами. Чатбот приоритизирует совпадения FAQ, затем использует базу знаний для подробных ответов и обращается к новостным статьям как к дополнительному источнику информации.

Основные Функции

Генерация Ответов на основе RAG

OpenAI GPT-4o-mini со структурированными ответами JSON

Векторный Поиск

Поиск схожести документов на основе embeddings

Интеграция Документов

Автоматическая индексация и векторизация документов

Интеграция FAQ

Поиск FAQ на основе ключевых слов с оценкой

Интеграция Новостей

Поиск новостных статей как резервный источник информации

Управление Вопросами

Автоматическое хранение и управление вопросами без ответов

Технологический Стек

Backend-Фреймворк

Laravel 11
PHP 8.2+
MySQL

ИИ & МО

OpenAI GPT-4o-mini
Vector Embeddings
RAG Technology

Frontend

Livewire
Alpine.js
Bootstrap

Управление Данными

Vector Store
TOON Format
JSON Schema

Рабочий Процесс

  1. Запрос Пользователя: Пользователь задает вопрос в чатботе
  2. Поиск FAQ: Система ищет в файлах FAQ с сопоставлением ключевых слов и оценкой
  3. Поиск Базы Знаний: Если оценка FAQ низкая, система ищет в векторизованных документах
  4. Форматирование Контекста: Результаты поиска форматируются как TOON (Token-Oriented Object Notation)
  5. Генерация Ответов: OpenAI GPT-4o-mini генерирует ответ на основе контекста со схемой JSON
  6. Отображение Источников: Релевантные источники документов отображаются с информацией о фрагментах
  7. Хранение Вопросов: Если ответ не найден, вопрос автоматически сохраняется для проверки
  8. Резерв Новостей: Если нет совпадения документа, система ищет в новостных статьях