Knowledge cutoff (granica wiedzy modelu)
Definicja
Knowledge cutoff to data, do której model miał dostęp do informacji podczas treningu. Po tej dacie model nie „wie”, co się wydarzyło - chyba że dostanie dane w kontekście, np. przez RAG albo narzędzie.
Co to w zasadzie jest?
Model jest jak książka wydana w konkretnym dniu. Może dobrze tłumaczyć i łączyć fakty, ale nie dopisuje automatycznie nowych rozdziałów o tym, co wydarzyło się później.
W praktyce oznacza to, że gdy pytasz o coś najnowszego, model może podać odpowiedź, która brzmi sensownie, ale nie jest aktualna. Dotyczy to zmian przepisów, cen, wydarzeń, funkcji narzędzi albo świeżych raportów.
Jeśli potrzebujesz aktualności, musisz dostarczyć je modelowi: wkleić materiał, dodać plik, użyć RAG albo narzędzia, które pobierze dane ze źródła.
Praktyczne zastosowania (konkretne scenariusze)
Scenariusz 1: Sprawdzenie zmian w prawie
- Cel: ograniczenie ryzyka nieaktualnej odpowiedzi.
- Wejście: pytanie o nowe przepisy.
- Kroki: podaj źródła -> sprawdź datę -> wygeneruj odpowiedź.
- Rezultat: odpowiedź oparta na aktualnym materiale.
- Zabezpieczenie: fact-checking i cytowanie źródeł.
Scenariusz 2: Streszczenie świeżego raportu
- Cel: praca na materiale, którego model nie zna z treningu.
- Wejście: raport lub jego fragmenty.
- Kroki: wklej materiał -> wskaż zakres -> poproś o streszczenie.
- Rezultat: streszczenie oparte na dostarczonym tekście.
- Zabezpieczenie: kontrola, czy odpowiedź nie wychodzi poza źródło.
Scenariusz 3: Porównanie ofert na dziś
- Cel: uniknięcie zgadywania cen i parametrów.
- Wejście: aktualne dane z ofert.
- Kroki: zbierz dane -> podaj je w kontekście -> porównaj kryteria.
- Rezultat: porównanie aktualne dla wskazanej daty.
- Zabezpieczenie: data porównania i lista źródeł.
Ryzyka i jak je ograniczać
Ryzyko 1: Nieaktualne odpowiedzi
- Ryzyko: Nieaktualne odpowiedzi.
- Jak ograniczać: podawaj daty, źródła i stosuj fact-checking.
Ryzyko 2: Mieszanie starych i nowych informacji
- Ryzyko: Mieszanie starych i nowych informacji.
- Jak ograniczać: dopisz w prompcie, że model ma wskazać braki danych.
Ryzyko 3: Fałszywa pewność
- Ryzyko: Fałszywa pewność.
- Jak ograniczać: wymagaj cytowania źródeł przy tematach zmiennych w czasie.
Checklista “zanim użyjesz”
- Czy pytanie dotyczy aktualnych informacji?
- Czy model dostał źródło nowsze niż jego granica wiedzy?
- Czy odpowiedź ma datę i źródła?
- Czy weryfikujesz fakty przed publikacją?
Diagram
flowchart LR
A[Wiedza z treningu]
B[Knowledge cutoff]
C[Nowe informacje]
D[RAG lub narzędzie]
E[Odpowiedź oparta na źródłach]
A --> B
C --> D --> E
B -. wymaga dopięcia danych .-> D
Diagram pokazuje, że po granicy wiedzy model potrzebuje aktualnych źródeł, aby nie zgadywać.
Dalsza lektura
Miejsce w mapie
- Knowledge cutoff → zwiększa wagę: Fact-checking
- Knowledge cutoff → wymaga aktualnych danych przez: RAG
- Knowledge cutoff → łączy się z: Grounding