Model zapasowy (Fallback model)

Definicja

Model zapasowy to drugi model albo tryb działania uruchamiany wtedy, gdy główny model nie działa, jest zbyt drogi, za wolny albo nie spełnia warunków jakości.

Co to w zasadzie jest?

To plan awaryjny dla aplikacji AI. Zamiast całkowitego błędu system może przełączyć się na prostszy model, odpowiedź szablonową albo bezpieczniejszy tryb działania.

Fallback pomaga wtedy, gdy:

usługa główna ma awarię,
odpowiedź trwa za długo,
koszt jednego zapytania jest za wysoki,
model nie daje wystarczającej jakości.

Praktyczne zastosowania (konkretne scenariusze)

Scenariusz 1: Awaria głównego dostawcy

Cel: utrzymać działanie usługi mimo problemu po stronie dostawcy.
Wejście: niedostępność API albo przekroczony timeout.
Kroki: wykrycie awarii -> przełączenie na model zapasowy -> zwrot odpowiedzi.
Rezultat: usługa działa dalej, choć w ograniczonym trybie.
Zabezpieczenie: testy przełączenia i monitoring awarii.

Scenariusz 2: Zbyt wysoki koszt zapytania

Cel: ograniczyć koszt przy prostych zadaniach.
Wejście: typ zapytania, koszt prognozowany i polityka routingu.
Kroki: ocena złożoności -> wybór tańszego modelu -> wykonanie zadania.
Rezultat: niższy koszt bez utraty działania systemu.
Zabezpieczenie: benchmark jakości dla klas zadań.

Scenariusz 3: Brak pewności odpowiedzi

Cel: nie wysyłać słabej odpowiedzi z głównego modelu.
Wejście: wynik głównego modelu i reguły jakości.
Kroki: ocena jakości -> odrzucenie wyniku -> przejście do trybu bezpiecznego.
Rezultat: użytkownik dostaje odpowiedź bardziej przewidywalną albo informację o ograniczeniu.
Zabezpieczenie: progi jakości i logika eskalacji.

Typowe błędy i pułapki

Brak testów fallbacku w praktyce.
Zapasowy model bez znanego poziomu jakości.
Przełączanie bez logowania decyzji.
Założenie, że model zapasowy „jakoś sobie poradzi”.

Ryzyka i jak je ograniczać

Ryzyko 1: Ukryty spadek jakości

Ryzyko: ukryty spadek jakości.
Jak ograniczać: mierz różnicę między trybami działania.

Ryzyko 2: Chaos operacyjny

Ryzyko: chaos operacyjny.
Jak ograniczać: jasno opisz warunki przełączenia.

Ryzyko 3: Brak przewidywalności

Ryzyko: brak przewidywalności.
Jak ograniczać: stosuj routing i progi jakości.

Ryzyko 4: Niezauważone awarie

Ryzyko: niezauważone awarie.
Jak ograniczać: monitoruj przełączenia i alerty.

Checklista „zanim użyjesz”

Czy wiadomo, kiedy uruchamia się fallback?
Czy model zapasowy był testowany?
Czy użytkownik wie, że działa tryb ograniczony?
Czy przełączenia są logowane?
Czy masz plan powrotu do trybu głównego?

Diagram

flowchart LR
    A[Zapytanie]
    B[Główny model]
    C[Warunek awarii lub słabej jakości]
    D[Model zapasowy]
    E[Odpowiedź]
    A --> B --> E
    B --> C --> D --> E

Diagram pokazuje, że fallback uruchamia się wtedy, gdy główny model nie spełnia warunków działania albo jakości.

Mapa powiązań

Model zapasowy (Fallback model) → wspiera: Prompt routing (kierowanie zapytań)
Model zapasowy (Fallback model) → wspiera: Timeout (limit czasu)
Model zapasowy (Fallback model) → wymaga: Monitoring jakości