Knowledgebase RAG System - Intelligente Chatbot-Integration

RAG-basierte Fragenbeantwortung mit Dokument-, FAQ- und News-Integration

2025-2026 Personal Project

Projektbeschreibung

Dieses Projekt implementiert ein umfassendes Wissensdatenbank-System mit Retrieval-Augmented Generation (RAG) Technologie für intelligente Fragenbeantwortung im Chatbot. Das System integriert Dokumente, FAQs und Nachrichtenartikel, um kontextbasierte Antworten mit OpenAI GPT-4o-mini zu liefern. Es verfügt über Vektorsuche für Dokumentähnlichkeit, TOON-Format für effiziente Kontextformatierung, automatische Speicherung unbeantworteter Fragen und nahtlose Integration mit dem Dokumentenmanagementsystem.

Hauptfunktionen

RAG-basierte Antwortgenerierung

OpenAI GPT-4o-mini mit strukturierten JSON-Antworten

Vektorsuche

Embedding-basierte Dokumentähnlichkeitssuche

Dokumenten-Integration

Automatische Indexierung und Vektorisierung von Dokumenten

FAQ-Integration

Keyword-basierte FAQ-Suche mit Scoring

News-Integration

Nachrichtenartikel-Suche als Fallback-Informationsquelle

Fragenverwaltung

Automatische Speicherung und Verwaltung unbeantworteter Fragen

Technologie-Stack

Backend-Framework

Laravel 11
PHP 8.2+
MySQL

KI & ML

OpenAI GPT-4o-mini
Vector Embeddings
RAG Technology

Frontend

Livewire
Alpine.js
Bootstrap

Daten-Management

Vector Store
TOON Format
JSON Schema

Workflow

  1. Benutzeranfrage: Benutzer stellt eine Frage im Chatbot
  2. FAQ-Suche: System sucht in FAQ-Dateien mit Keyword-Matching und Scoring
  3. Wissensdatenbank-Suche: Falls FAQ-Score niedrig, sucht System in vektorisierten Dokumenten
  4. Kontext-Formatierung: Suchergebnisse werden als TOON (Token-Oriented Object Notation) formatiert
  5. Antwort-Generierung: OpenAI GPT-4o-mini generiert Antwort basierend auf Kontext mit JSON-Schema
  6. Quellen-Anzeige: Relevante Dokumentquellen werden mit Chunk-Informationen angezeigt
  7. Fragen-Speicherung: Falls keine Antwort gefunden, wird Frage automatisch zur Überprüfung gespeichert
  8. News-Fallback: Falls kein Dokument-Match, sucht System in Nachrichtenartikeln