RAG

Definicja

RAG (Retrieval-Augmented Generation, czyli generowanie wzbogacone wyszukiwaniem) to podejście, w którym model najpierw wyszukuje fragmenty z dokumentów, a potem tworzy odpowiedź na ich podstawie. RAG nie jest osobnym modelem, tylko sposobem łączenia wyszukiwania z generowaniem. To rozwiązanie zwiększa wiarygodność odpowiedzi, gdy źródła są aktualne.

Co to w zasadzie jest?

Model „zagląda” do dokumentów, zamiast odpowiadać z pamięci.
Dzięki temu łatwiej ograniczyć halucynacje i podać źródła.
Jakość zależy od jakości bazy wiedzy.
RAG to część aplikacji, a nie samodzielny produkt.

Praktyczne zastosowania (konkretne scenariusze)

Scenariusz 1: Odpowiedzi na pytania klientów

Cel: odpowiedzi na pytania klientów.
Wejście: pytanie + baza regulaminów.
Kroki: wyszukaj → odpowiedz → cytuj źródło.
Rezultat: spójna odpowiedź.
Zabezpieczenie: aktualizacja bazy.

Scenariusz 2: Wsparcie działu sprzedaży

Cel: wsparcie działu sprzedaży.
Wejście: oferta i FAQ.
Kroki: RAG → szkic odpowiedzi → review.
Rezultat: szybsze odpowiedzi.
Zabezpieczenie: kontrola obietnic.

Scenariusz 3: Wewnętrzna baza wiedzy

Cel: wewnętrzna baza wiedzy.
Wejście: instrukcje i procedury.
Kroki: indeks → zapytanie → cytaty.
Rezultat: odpowiedź z linkami.
Zabezpieczenie: wersjonowanie dokumentów.

Typowe błędy i pułapki

Nieaktualna baza wiedzy.
Brak cytatów lub źródeł.
Mieszanie dokumentów z różnych obszarów.

Ryzyka i jak je ograniczać

Ryzyko 1: Prompt injection w źródłach

Ryzyko: Prompt injection w źródłach.
Jak ograniczać: filtracja i review dokumentów.

Ryzyko 2: Halucynacje mimo źródeł

Ryzyko: Halucynacje mimo źródeł.
Jak ograniczać: weryfikacja odpowiedzi.

Ryzyko 3: Dane osobowe

Ryzyko: Dane osobowe.
Jak ograniczać: anonimizacja i dostęp rolowy.

Checklista “zanim użyjesz”

Czy baza dokumentów jest aktualna?
Czy odpowiedzi mają cytaty i źródła?
Czy dane wrażliwe są usunięte?
Czy wynik jest sprawdzany przez człowieka?
Czy logujesz zapytania i odpowiedzi?

Diagram

flowchart LR
    A[Pytanie]
    B[Wyszukiwanie w źródłach]
    C[Wybrane fragmenty]
    D[LLM]
    E[Odpowiedź z cytatem]
    A --> B --> C --> D --> E

Diagram pokazuje, że RAG łączy wyszukiwanie dokumentów z generowaniem odpowiedzi na ich podstawie.

Dalsza lektura

Miejsce w mapie

RAG → używa: Embedding
RAG → wspiera: Grounding
RAG → wymaga: Baza wektorowa

RAG