Przejdź do treści

Reranking (ponowne sortowanie wyników)

Definicja

Reranking to etap, w którym system bierze wstępną listę wyników wyszukiwania (np. 20 fragmentów) i ponownie je sortuje, żeby na górze były najbardziej trafne.

Co to w zasadzie jest?

Wyszukiwarka często zwraca „coś podobnego”. Reranking to dodatkowe sito: „z tych 20 wybierz 5 najlepszych”. Dzięki temu AI dostaje lepszy kontekst, a odpowiedzi są bardziej na temat.

Praktyczne zastosowania (konkretne scenariusze)

Scenariusz 1: W pojęciowniku

  • Cel: zapytanie „prompt injection” → reranking wybiera fragmenty o ataku, a nie ogólnie o promptach.
  • Wejście: lista wyników wyszukiwania.
  • Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
  • Rezultat: trafniejszy kontekst dla modelu.
  • Zabezpieczenie: limity wyników i testy jakości.

Scenariusz 2: W firmie

  • Cel: „procedura urlopowa” → reranking wybiera aktualny dokument, a nie stary.
  • Wejście: lista wyników wyszukiwania.
  • Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
  • Rezultat: trafniejszy kontekst dla modelu.
  • Zabezpieczenie: limity wyników i testy jakości.

Scenariusz 3: W aplikacji

  • Cel: „jak zresetować hasło” → reranking podbija artykuł „Reset hasła”, a nie „polityka haseł”.
  • Wejście: lista wyników wyszukiwania.
  • Kroki: pobierz kandydatów -> ponownie oceń -> wybierz najlepsze fragmenty.
  • Rezultat: trafniejszy kontekst dla modelu.
  • Zabezpieczenie: limity wyników i testy jakości.

Ryzyka i jak je ograniczać

Ryzyko 1: Reranker promuje „ładne” teksty, a nie prawdziwe

  • Ryzyko: reranker promuje „ładne” teksty, a nie prawdziwe.
  • Jak ograniczać: testy na zestawach pytań + metryki jakości + ręczna kontrola.

Ryzyko 2: Koszty i opóźnienia

  • Ryzyko: koszty i opóźnienia.
  • Jak ograniczać: rerank tylko top-k, cache, profilowanie.

Ryzyko 3: Bias w wynikach

  • Ryzyko: bias w wynikach.
  • Jak ograniczać: audyt i obserwacja, różne typy pytań, analiza błędów.

Mapa powiązań

Diagram

flowchart LR
    A[Wyniki top-20]
    B[Reranking]
    C[Top-5]
    D[Kontekst]
    E[Lepsza odpowiedź]
    A --> B --> C --> D --> E

Diagram pokazuje, że po wstępnym wyszukaniu system wybiera najbardziej trafne fragmenty do odpowiedzi.

Dalsza lektura