Przejdź do treści

RAG

Definicja

RAG (Retrieval-Augmented Generation, czyli generowanie wzbogacone wyszukiwaniem) to podejście, w którym model najpierw wyszukuje fragmenty z dokumentów, a potem tworzy odpowiedź na ich podstawie. RAG nie jest osobnym modelem, tylko sposobem łączenia wyszukiwania z generowaniem. To rozwiązanie zwiększa wiarygodność odpowiedzi, gdy źródła są aktualne.

Co to w zasadzie jest?

  • Model „zagląda” do dokumentów, zamiast odpowiadać z pamięci.
  • Dzięki temu łatwiej ograniczyć halucynacje i podać źródła.
  • Jakość zależy od jakości bazy wiedzy.
  • RAG to część aplikacji, a nie samodzielny produkt.

Praktyczne zastosowania (konkretne scenariusze)

Scenariusz 1: Odpowiedzi na pytania klientów

  • Cel: odpowiedzi na pytania klientów.
  • Wejście: pytanie + baza regulaminów.
  • Kroki: wyszukaj → odpowiedz → cytuj źródło.
  • Rezultat: spójna odpowiedź.
  • Zabezpieczenie: aktualizacja bazy.

Scenariusz 2: Wsparcie działu sprzedaży

  • Cel: wsparcie działu sprzedaży.
  • Wejście: oferta i FAQ.
  • Kroki: RAG → szkic odpowiedzi → review.
  • Rezultat: szybsze odpowiedzi.
  • Zabezpieczenie: kontrola obietnic.

Scenariusz 3: Wewnętrzna baza wiedzy

  • Cel: wewnętrzna baza wiedzy.
  • Wejście: instrukcje i procedury.
  • Kroki: indeks → zapytanie → cytaty.
  • Rezultat: odpowiedź z linkami.
  • Zabezpieczenie: wersjonowanie dokumentów.

Typowe błędy i pułapki

  • Nieaktualna baza wiedzy.
  • Brak cytatów lub źródeł.
  • Mieszanie dokumentów z różnych obszarów.

Ryzyka i jak je ograniczać

Ryzyko 1: Prompt injection w źródłach

  • Ryzyko: Prompt injection w źródłach.
  • Jak ograniczać: filtracja i review dokumentów.

Ryzyko 2: Halucynacje mimo źródeł

  • Ryzyko: Halucynacje mimo źródeł.
  • Jak ograniczać: weryfikacja odpowiedzi.

Ryzyko 3: Dane osobowe

  • Ryzyko: Dane osobowe.
  • Jak ograniczać: anonimizacja i dostęp rolowy.

Checklista “zanim użyjesz”

  • Czy baza dokumentów jest aktualna?
  • Czy odpowiedzi mają cytaty i źródła?
  • Czy dane wrażliwe są usunięte?
  • Czy wynik jest sprawdzany przez człowieka?
  • Czy logujesz zapytania i odpowiedzi?

Diagram

flowchart LR
    A[Pytanie]
    B[Wyszukiwanie w źródłach]
    C[Wybrane fragmenty]
    D[LLM]
    E[Odpowiedź z cytatem]
    A --> B --> C --> D --> E

Diagram pokazuje, że RAG łączy wyszukiwanie dokumentów z generowaniem odpowiedzi na ich podstawie.

Dalsza lektura

Miejsce w mapie

Powiązane hasła