Wyjaśnialność (explainability)
Definicja
Wyjaśnialność to możliwość uzasadnienia, dlaczego system AI dał taki wynik i na czym się oparł.
Co to w zasadzie jest?
- W firmie „bo tak wyszło” nie wystarcza.
- Wyjaśnialność może oznaczać: źródła, kroki, kryteria, logi.
- Najprościej: cytaty + ślad audytowy + jasne zasady.
Praktyczne zastosowania (konkretne scenariusze)
Scenariusz 1: Asystent procedur
- Cel: asystent procedur: odpowiedź zawsze z linkiem do dokumentu.
- Wejście: decyzja modelu, dane wejściowe i reguły procesu.
- Kroki: pokaż podstawę -> opisz kryteria -> wskaż ograniczenia.
- Rezultat: łatwiejsze zrozumienie wyniku.
- Zabezpieczenie: nie myl wyjaśnienia z dowodem poprawności.
Scenariusz 2: Klasyfikacja spraw
- Cel: klasyfikacja spraw: pokazanie reguł i progów.
- Wejście: decyzja modelu, dane wejściowe i reguły procesu.
- Kroki: pokaż podstawę -> opisz kryteria -> wskaż ograniczenia.
- Rezultat: łatwiejsze zrozumienie wyniku.
- Zabezpieczenie: nie myl wyjaśnienia z dowodem poprawności.
Scenariusz 3: Podsumowania
- Cel: podsumowania: wskazanie, z jakich notatek powstały.
- Wejście: decyzja modelu, dane wejściowe i reguły procesu.
- Kroki: pokaż podstawę -> opisz kryteria -> wskaż ograniczenia.
- Rezultat: łatwiejsze zrozumienie wyniku.
- Zabezpieczenie: nie myl wyjaśnienia z dowodem poprawności.
Typowe błędy i pułapki
- Brak źródeł.
- Brak logów procesu.
Ryzyka i jak je ograniczać
Ryzyko 1: Brak zaufania
- Ryzyko: Brak zaufania.
- Jak ograniczać: cytaty i transparentność.
Ryzyko 2: Błędy bez możliwości odtworzenia
- Ryzyko: Błędy bez możliwości odtworzenia.
- Jak ograniczać: audit trail.
Ryzyko 3: Nadmierne uproszczenia
- Ryzyko: Nadmierne uproszczenia.
- Jak ograniczać: opis ograniczeń.
Checklista “zanim użyjesz”
- Czy wynik ma źródła?
- Czy potrafię odtworzyć proces?
- Czy są logi i wersje?
- Czy opisuję ograniczenia?
- Czy człowiek zatwierdza?
Diagram
flowchart LR
A[Dane]
B[Wynik]
C[Źródła i logi]
D[Uzasadnienie]
E[Większe zaufanie]
A --> B --> C --> D --> E
Diagram pokazuje, że wynik systemu powinien być możliwy do uzasadnienia przez źródła, logi lub kryteria.
Dalsza lektura
Miejsce w mapie
- Explainability → wspiera: Audit trail
- Explainability → wspiera: Cytowanie źródeł
- Explainability → wymaga: Grounding