Système RAG de Base de Connaissances - Intégration Intelligente de Chatbot
Question-Réponse basée sur RAG avec Intégration de Documents, FAQ et Actualités
Description du Projet
Ce projet implémente un système complet de base de connaissances utilisant la technologie Retrieval-Augmented Generation (RAG) pour les questions-réponses intelligentes dans le chatbot. Le système intègre des documents, des FAQ et des articles de presse pour fournir des réponses basées sur le contexte en utilisant OpenAI GPT-4o-mini. Il propose une recherche vectorielle pour la similarité des documents, le format TOON pour un formatage de contexte efficace, le stockage automatique des questions sans réponse et une intégration transparente avec le système de gestion de documents. Le chatbot priorise les correspondances FAQ, puis utilise la base de connaissances pour des réponses détaillées, et se rabat sur les articles de presse comme source d'information supplémentaire.
Fonctionnalités Principales
Génération de Réponses basée sur RAG
OpenAI GPT-4o-mini avec réponses JSON structurées
Recherche Vectorielle
Recherche de similarité de documents basée sur les embeddings
Intégration de Documents
Indexation et vectorisation automatiques des documents
Intégration FAQ
Recherche FAQ basée sur les mots-clés avec notation
Intégration Actualités
Recherche d'articles de presse comme source d'information de secours
Gestion des Questions
Stockage et gestion automatiques des questions sans réponse
Pile Technologique
Framework Backend
IA & ML
Frontend
Gestion des Données
Flux de Travail
- Requête Utilisateur: L'utilisateur pose une question dans le chatbot
- Recherche FAQ: Le système recherche dans les fichiers FAQ avec correspondance de mots-clés et notation
- Recherche Base de Connaissances: Si le score FAQ est faible, le système recherche dans les documents vectorisés
- Formatage de Contexte: Les résultats de recherche sont formatés en TOON (Token-Oriented Object Notation)
- Génération de Réponses: OpenAI GPT-4o-mini génère une réponse basée sur le contexte avec schéma JSON
- Affichage des Sources: Les sources de documents pertinentes sont affichées avec les informations de chunk
- Stockage des Questions: Si aucune réponse n'est trouvée, la question est automatiquement stockée pour examen
- Secours Actualités: Si aucune correspondance de document, le système recherche dans les articles de presse