System bazy wiedzy RAG - Inteligentna integracja chatbota
Pytania i odpowiedzi oparte na RAG z integracją dokumentów, FAQ i aktualności
Opis projektu
Ten projekt implementuje kompleksowy system bazy wiedzy wykorzystujący technologię Retrieval-Augmented Generation (RAG) do inteligentnych pytań i odpowiedzi w chatbocie. System integruje dokumenty, FAQ i artykuły informacyjne, aby dostarczać odpowiedzi oparte na kontekście używając OpenAI GPT-4o-mini. Zawiera wyszukiwanie wektorowe dla podobieństwa dokumentów, format TOON dla efektywnego formatowania kontekstu, automatyczne przechowywanie pytań bez odpowiedzi i bezproblemową integrację z systemem zarządzania dokumentami.
Główne funkcje
Generowanie odpowiedzi oparte na RAG
OpenAI GPT-4o-mini ze strukturalnymi odpowiedziami JSON
Wyszukiwanie wektorowe
Wyszukiwanie podobieństwa dokumentów oparte na embeddingach
Integracja dokumentów
Automatyczna indeksacja i wektoryzacja dokumentów
Integracja FAQ
Wyszukiwanie FAQ oparte na słowach kluczowych ze scoringiem
Integracja aktualności
Wyszukiwanie artykułów informacyjnych jako zapasowe źródło informacji
Zarządzanie pytaniami
Automatyczne przechowywanie i zarządzanie pytaniami bez odpowiedzi
Stos technologiczny
Framework backend
AI & ML
Frontend
Zarządzanie danymi
Przepływ pracy
- Zapytanie użytkownika: Użytkownik zadaje pytanie w chatbocie
- Wyszukiwanie FAQ: System wyszukuje w plikach FAQ z dopasowaniem słów kluczowych i scoringiem
- Wyszukiwanie w bazie wiedzy: Jeśli wynik FAQ jest niski, system wyszukuje w zwektoryzowanych dokumentach
- Formatowanie kontekstu: Wyniki wyszukiwania są formatowane jako TOON (Token-Oriented Object Notation)
- Generowanie odpowiedzi: OpenAI GPT-4o-mini generuje odpowiedź opartą na kontekście ze schematem JSON
- Wyświetlanie źródeł: Odpowiednie źródła dokumentów są wyświetlane z informacjami o fragmentach
- Przechowywanie pytań: Jeśli nie znaleziono odpowiedzi, pytanie jest automatycznie przechowywane do przeglądu
- Zapas aktualności: Jeśli nie ma dopasowania dokumentu, system wyszukuje w artykułach informacyjnych