Sistema RAG de Base de Conocimientos - Integración Inteligente de Chatbot
Preguntas y Respuestas basadas en RAG con Integración de Documentos, FAQ y Noticias
Descripción del Proyecto
Este proyecto implementa un sistema integral de base de conocimientos utilizando tecnología Retrieval-Augmented Generation (RAG) para preguntas y respuestas inteligentes en el chatbot. El sistema integra documentos, preguntas frecuentes y artículos de noticias para proporcionar respuestas basadas en contexto usando OpenAI GPT-4o-mini. Cuenta con búsqueda vectorial para similitud de documentos, formato TOON para formateo eficiente de contexto, almacenamiento automático de preguntas sin respuesta e integración perfecta con el sistema de gestión de documentos. El chatbot prioriza coincidencias de FAQ, luego usa la base de conocimientos para respuestas detalladas y recurre a artículos de noticias como fuente de información adicional.
Características Principales
Generación de Respuestas basada en RAG
OpenAI GPT-4o-mini con respuestas JSON estructuradas
Búsqueda Vectorial
Búsqueda de similitud de documentos basada en embeddings
Integración de Documentos
Indexación y vectorización automática de documentos
Integración de FAQ
Búsqueda de FAQ basada en palabras clave con puntuación
Integración de Noticias
Búsqueda de artículos de noticias como fuente de información de respaldo
Gestión de Preguntas
Almacenamiento y gestión automática de preguntas sin respuesta
Stack Tecnológico
Framework Backend
IA & ML
Frontend
Gestión de Datos
Flujo de Trabajo
- Consulta del Usuario: El usuario hace una pregunta en el chatbot
- Búsqueda de FAQ: El sistema busca en archivos FAQ con coincidencia de palabras clave y puntuación
- Búsqueda de Base de Conocimientos: Si la puntuación de FAQ es baja, el sistema busca en documentos vectorizados
- Formateo de Contexto: Los resultados de búsqueda se formatean como TOON (Token-Oriented Object Notation)
- Generación de Respuestas: OpenAI GPT-4o-mini genera respuesta basada en contexto con esquema JSON
- Visualización de Fuentes: Las fuentes de documentos relevantes se muestran con información de fragmentos
- Almacenamiento de Preguntas: Si no se encuentra respuesta, la pregunta se almacena automáticamente para revisión
- Respaldo de Noticias: Si no hay coincidencia de documento, el sistema busca en artículos de noticias