Système de base de connaissances RAG - Intégration chatbot intelligente
Questions-réponses basées sur RAG avec intégration de documents, FAQ et actualités
Description du projet
Ce projet implémente un système complet de base de connaissances utilisant la technologie Retrieval-Augmented Generation (RAG) pour des questions-réponses intelligentes dans le chatbot. Le système intègre documents, FAQs et articles d'actualités pour fournir des réponses basées sur le contexte en utilisant OpenAI GPT-4o-mini. Il comprend la recherche vectorielle pour la similarité de documents, le format TOON pour le formatage efficace du contexte, le stockage automatique des questions sans réponse et une intégration transparente avec le système de gestion de documents.
Fonctionnalités principales
Génération de réponses basée sur RAG
OpenAI GPT-4o-mini avec réponses JSON structurées
Recherche vectorielle
Recherche de similarité de documents basée sur les embeddings
Intégration de documents
Indexation et vectorisation automatiques des documents
Intégration FAQ
Recherche FAQ basée sur mots-clés avec scoring
Intégration actualités
Recherche d'articles d'actualités comme source d'information de secours
Gestion des questions
Stockage et gestion automatiques des questions sans réponse
Stack technologique
Framework backend
IA & ML
Frontend
Gestion des données
Workflow
- Requête utilisateur : L'utilisateur pose une question dans le chatbot
- Recherche FAQ : Le système recherche dans les fichiers FAQ avec correspondance de mots-clés et scoring
- Recherche base de connaissances : Si le score FAQ est bas, le système recherche dans les documents vectorisés
- Formatage du contexte : Les résultats de recherche sont formatés en TOON (Token-Oriented Object Notation)
- Génération de réponse : OpenAI GPT-4o-mini génère une réponse basée sur le contexte avec schéma JSON
- Affichage des sources : Les sources de documents pertinentes sont affichées avec informations de chunk
- Stockage des questions : Si aucune réponse trouvée, la question est automatiquement stockée pour révision
- Secours actualités : Si aucune correspondance de document, le système recherche dans les articles d'actualités