Sistema RAG de Base de Conocimientos - Integración Inteligente de Chatbot

Preguntas y Respuestas basadas en RAG con Integración de Documentos, FAQ y Noticias

2025-2026 Proyecto Personal

Descripción del Proyecto

Este proyecto implementa un sistema integral de base de conocimientos utilizando tecnología Retrieval-Augmented Generation (RAG) para preguntas y respuestas inteligentes en el chatbot. El sistema integra documentos, preguntas frecuentes y artículos de noticias para proporcionar respuestas basadas en contexto usando OpenAI GPT-4o-mini. Cuenta con búsqueda vectorial para similitud de documentos, formato TOON para formateo eficiente de contexto, almacenamiento automático de preguntas sin respuesta e integración perfecta con el sistema de gestión de documentos. El chatbot prioriza coincidencias de FAQ, luego usa la base de conocimientos para respuestas detalladas y recurre a artículos de noticias como fuente de información adicional.

Características Principales

Generación de Respuestas basada en RAG

OpenAI GPT-4o-mini con respuestas JSON estructuradas

Búsqueda Vectorial

Búsqueda de similitud de documentos basada en embeddings

Integración de Documentos

Indexación y vectorización automática de documentos

Integración de FAQ

Búsqueda de FAQ basada en palabras clave con puntuación

Integración de Noticias

Búsqueda de artículos de noticias como fuente de información de respaldo

Gestión de Preguntas

Almacenamiento y gestión automática de preguntas sin respuesta

Stack Tecnológico

Framework Backend

Laravel 11
PHP 8.2+
MySQL

IA & ML

OpenAI GPT-4o-mini
Vector Embeddings
RAG Technology

Frontend

Livewire
Alpine.js
Bootstrap

Gestión de Datos

Vector Store
TOON Format
JSON Schema

Flujo de Trabajo

  1. Consulta del Usuario: El usuario hace una pregunta en el chatbot
  2. Búsqueda de FAQ: El sistema busca en archivos FAQ con coincidencia de palabras clave y puntuación
  3. Búsqueda de Base de Conocimientos: Si la puntuación de FAQ es baja, el sistema busca en documentos vectorizados
  4. Formateo de Contexto: Los resultados de búsqueda se formatean como TOON (Token-Oriented Object Notation)
  5. Generación de Respuestas: OpenAI GPT-4o-mini genera respuesta basada en contexto con esquema JSON
  6. Visualización de Fuentes: Las fuentes de documentos relevantes se muestran con información de fragmentos
  7. Almacenamiento de Preguntas: Si no se encuentra respuesta, la pregunta se almacena automáticamente para revisión
  8. Respaldo de Noticias: Si no hay coincidencia de documento, el sistema busca en artículos de noticias