RAG
Definicja
RAG (Retrieval-Augmented Generation, czyli generowanie wzbogacone wyszukiwaniem) to podejście, w którym model najpierw wyszukuje fragmenty z dokumentów, a potem tworzy odpowiedź na ich podstawie. RAG nie jest osobnym modelem, tylko sposobem łączenia wyszukiwania z generowaniem. To rozwiązanie zwiększa wiarygodność odpowiedzi, gdy źródła są aktualne.
Co to w zasadzie jest?
- Model „zagląda” do dokumentów, zamiast odpowiadać z pamięci.
- Dzięki temu łatwiej ograniczyć halucynacje i podać źródła.
- Jakość zależy od jakości bazy wiedzy.
- RAG to część aplikacji, a nie samodzielny produkt.
Praktyczne zastosowania (konkretne scenariusze)
Scenariusz 1: Odpowiedzi na pytania klientów
- Cel: odpowiedzi na pytania klientów.
- Wejście: pytanie + baza regulaminów.
- Kroki: wyszukaj → odpowiedz → cytuj źródło.
- Rezultat: spójna odpowiedź.
- Zabezpieczenie: aktualizacja bazy.
Scenariusz 2: Wsparcie działu sprzedaży
- Cel: wsparcie działu sprzedaży.
- Wejście: oferta i FAQ.
- Kroki: RAG → szkic odpowiedzi → review.
- Rezultat: szybsze odpowiedzi.
- Zabezpieczenie: kontrola obietnic.
Scenariusz 3: Wewnętrzna baza wiedzy
- Cel: wewnętrzna baza wiedzy.
- Wejście: instrukcje i procedury.
- Kroki: indeks → zapytanie → cytaty.
- Rezultat: odpowiedź z linkami.
- Zabezpieczenie: wersjonowanie dokumentów.
Typowe błędy i pułapki
- Nieaktualna baza wiedzy.
- Brak cytatów lub źródeł.
- Mieszanie dokumentów z różnych obszarów.
Ryzyka i jak je ograniczać
Ryzyko 1: Prompt injection w źródłach
- Ryzyko: Prompt injection w źródłach.
- Jak ograniczać: filtracja i review dokumentów.
Ryzyko 2: Halucynacje mimo źródeł
- Ryzyko: Halucynacje mimo źródeł.
- Jak ograniczać: weryfikacja odpowiedzi.
Ryzyko 3: Dane osobowe
- Ryzyko: Dane osobowe.
- Jak ograniczać: anonimizacja i dostęp rolowy.
Checklista “zanim użyjesz”
- Czy baza dokumentów jest aktualna?
- Czy odpowiedzi mają cytaty i źródła?
- Czy dane wrażliwe są usunięte?
- Czy wynik jest sprawdzany przez człowieka?
- Czy logujesz zapytania i odpowiedzi?
Diagram
flowchart LR
A[Pytanie]
B[Wyszukiwanie w źródłach]
C[Wybrane fragmenty]
D[LLM]
E[Odpowiedź z cytatem]
A --> B --> C --> D --> E
Diagram pokazuje, że RAG łączy wyszukiwanie dokumentów z generowaniem odpowiedzi na ich podstawie.
Dalsza lektura
Miejsce w mapie
- RAG → używa: Embedding
- RAG → wspiera: Grounding
- RAG → wymaga: Baza wektorowa