Système de base de connaissances RAG - Intégration chatbot intelligente

Questions-réponses basées sur RAG avec intégration de documents, FAQ et actualités

2025-2026 Personal Project

Description du projet

Ce projet implémente un système complet de base de connaissances utilisant la technologie Retrieval-Augmented Generation (RAG) pour des questions-réponses intelligentes dans le chatbot. Le système intègre documents, FAQs et articles d'actualités pour fournir des réponses basées sur le contexte en utilisant OpenAI GPT-4o-mini. Il comprend la recherche vectorielle pour la similarité de documents, le format TOON pour le formatage efficace du contexte, le stockage automatique des questions sans réponse et une intégration transparente avec le système de gestion de documents.

Fonctionnalités principales

Génération de réponses basée sur RAG

OpenAI GPT-4o-mini avec réponses JSON structurées

Recherche vectorielle

Recherche de similarité de documents basée sur les embeddings

Intégration de documents

Indexation et vectorisation automatiques des documents

Intégration FAQ

Recherche FAQ basée sur mots-clés avec scoring

Intégration actualités

Recherche d'articles d'actualités comme source d'information de secours

Gestion des questions

Stockage et gestion automatiques des questions sans réponse

Stack technologique

Framework backend

Laravel 11
PHP 8.2+
MySQL

IA & ML

OpenAI GPT-4o-mini
Embeddings vectoriels
Technologie RAG

Frontend

Livewire
Alpine.js
Bootstrap

Gestion des données

Vector Store
Format TOON
JSON Schema

Workflow

  1. Requête utilisateur : L'utilisateur pose une question dans le chatbot
  2. Recherche FAQ : Le système recherche dans les fichiers FAQ avec correspondance de mots-clés et scoring
  3. Recherche base de connaissances : Si le score FAQ est bas, le système recherche dans les documents vectorisés
  4. Formatage du contexte : Les résultats de recherche sont formatés en TOON (Token-Oriented Object Notation)
  5. Génération de réponse : OpenAI GPT-4o-mini génère une réponse basée sur le contexte avec schéma JSON
  6. Affichage des sources : Les sources de documents pertinentes sont affichées avec informations de chunk
  7. Stockage des questions : Si aucune réponse trouvée, la question est automatiquement stockée pour révision
  8. Secours actualités : Si aucune correspondance de document, le système recherche dans les articles d'actualités