Knowledge cutoff (granica wiedzy modelu)

Definicja

Knowledge cutoff to data, do której model miał dostęp do informacji podczas treningu. Po tej dacie model nie „wie”, co się wydarzyło - chyba że dostanie dane w kontekście, np. przez RAG albo narzędzie.

Co to w zasadzie jest?

Model jest jak książka wydana w konkretnym dniu. Może dobrze tłumaczyć i łączyć fakty, ale nie dopisuje automatycznie nowych rozdziałów o tym, co wydarzyło się później.

W praktyce oznacza to, że gdy pytasz o coś najnowszego, model może podać odpowiedź, która brzmi sensownie, ale nie jest aktualna. Dotyczy to zmian przepisów, cen, wydarzeń, funkcji narzędzi albo świeżych raportów.

Jeśli potrzebujesz aktualności, musisz dostarczyć je modelowi: wkleić materiał, dodać plik, użyć RAG albo narzędzia, które pobierze dane ze źródła.

Praktyczne zastosowania (konkretne scenariusze)

Scenariusz 1: Sprawdzenie zmian w prawie

Cel: ograniczenie ryzyka nieaktualnej odpowiedzi.
Wejście: pytanie o nowe przepisy.
Kroki: podaj źródła -> sprawdź datę -> wygeneruj odpowiedź.
Rezultat: odpowiedź oparta na aktualnym materiale.
Zabezpieczenie: fact-checking i cytowanie źródeł.

Scenariusz 2: Streszczenie świeżego raportu

Cel: praca na materiale, którego model nie zna z treningu.
Wejście: raport lub jego fragmenty.
Kroki: wklej materiał -> wskaż zakres -> poproś o streszczenie.
Rezultat: streszczenie oparte na dostarczonym tekście.
Zabezpieczenie: kontrola, czy odpowiedź nie wychodzi poza źródło.

Scenariusz 3: Porównanie ofert na dziś

Cel: uniknięcie zgadywania cen i parametrów.
Wejście: aktualne dane z ofert.
Kroki: zbierz dane -> podaj je w kontekście -> porównaj kryteria.
Rezultat: porównanie aktualne dla wskazanej daty.
Zabezpieczenie: data porównania i lista źródeł.

Ryzyka i jak je ograniczać

Ryzyko 1: Nieaktualne odpowiedzi

Ryzyko: Nieaktualne odpowiedzi.
Jak ograniczać: podawaj daty, źródła i stosuj fact-checking.

Ryzyko 2: Mieszanie starych i nowych informacji

Ryzyko: Mieszanie starych i nowych informacji.
Jak ograniczać: dopisz w prompcie, że model ma wskazać braki danych.

Ryzyko 3: Fałszywa pewność

Ryzyko: Fałszywa pewność.
Jak ograniczać: wymagaj cytowania źródeł przy tematach zmiennych w czasie.

Checklista “zanim użyjesz”

Czy pytanie dotyczy aktualnych informacji?
Czy model dostał źródło nowsze niż jego granica wiedzy?
Czy odpowiedź ma datę i źródła?
Czy weryfikujesz fakty przed publikacją?

Diagram

flowchart LR
    A[Wiedza z treningu]
    B[Knowledge cutoff]
    C[Nowe informacje]
    D[RAG lub narzędzie]
    E[Odpowiedź oparta na źródłach]
    A --> B
    C --> D --> E
    B -. wymaga dopięcia danych .-> D

Diagram pokazuje, że po granicy wiedzy model potrzebuje aktualnych źródeł, aby nie zgadywać.

Dalsza lektura

Miejsce w mapie

Knowledge cutoff → zwiększa wagę: Fact-checking
Knowledge cutoff → wymaga aktualnych danych przez: RAG
Knowledge cutoff → łączy się z: Grounding