Système RAG de Base de Connaissances - Intégration Intelligente de Chatbot

Question-Réponse basée sur RAG avec Intégration de Documents, FAQ et Actualités

2025-2026 Projet Personnel

Description du Projet

Ce projet implémente un système complet de base de connaissances utilisant la technologie Retrieval-Augmented Generation (RAG) pour les questions-réponses intelligentes dans le chatbot. Le système intègre des documents, des FAQ et des articles de presse pour fournir des réponses basées sur le contexte en utilisant OpenAI GPT-4o-mini. Il propose une recherche vectorielle pour la similarité des documents, le format TOON pour un formatage de contexte efficace, le stockage automatique des questions sans réponse et une intégration transparente avec le système de gestion de documents. Le chatbot priorise les correspondances FAQ, puis utilise la base de connaissances pour des réponses détaillées, et se rabat sur les articles de presse comme source d'information supplémentaire.

Fonctionnalités Principales

Génération de Réponses basée sur RAG

OpenAI GPT-4o-mini avec réponses JSON structurées

Recherche Vectorielle

Recherche de similarité de documents basée sur les embeddings

Intégration de Documents

Indexation et vectorisation automatiques des documents

Intégration FAQ

Recherche FAQ basée sur les mots-clés avec notation

Intégration Actualités

Recherche d'articles de presse comme source d'information de secours

Gestion des Questions

Stockage et gestion automatiques des questions sans réponse

Pile Technologique

Framework Backend

Laravel 11
PHP 8.2+
MySQL

IA & ML

OpenAI GPT-4o-mini
Vector Embeddings
RAG Technology

Frontend

Livewire
Alpine.js
Bootstrap

Gestion des Données

Vector Store
TOON Format
JSON Schema

Flux de Travail

  1. Requête Utilisateur: L'utilisateur pose une question dans le chatbot
  2. Recherche FAQ: Le système recherche dans les fichiers FAQ avec correspondance de mots-clés et notation
  3. Recherche Base de Connaissances: Si le score FAQ est faible, le système recherche dans les documents vectorisés
  4. Formatage de Contexte: Les résultats de recherche sont formatés en TOON (Token-Oriented Object Notation)
  5. Génération de Réponses: OpenAI GPT-4o-mini génère une réponse basée sur le contexte avec schéma JSON
  6. Affichage des Sources: Les sources de documents pertinentes sont affichées avec les informations de chunk
  7. Stockage des Questions: Si aucune réponse n'est trouvée, la question est automatiquement stockée pour examen
  8. Secours Actualités: Si aucune correspondance de document, le système recherche dans les articles de presse