Dane osobowe (PII)
Definicja
PII (dane osobowe) to informacje, które pozwalają zidentyfikować osobę bezpośrednio lub pośrednio.
Co to w zasadzie jest?
- To np. imię i nazwisko, PESEL, adres, numer telefonu, ale też zestaw danych, który razem wskazuje osobę.
- W kontekście AI najważniejsze jest: nie wklejać danych, jeśli nie ma do tego podstaw i zabezpieczeń.
- Bezpieczniej pracować na danych zanonimizowanych.
Praktyczne zastosowania (konkretne scenariusze)
Scenariusz 1: Tworzenie odpowiedzi „na szablonie” bez wklejania danych wrażliwych
- Cel: tworzenie odpowiedzi „na szablonie” bez wklejania danych wrażliwych.
- Wejście: tekst zawierający możliwe dane osobowe.
- Kroki: wykryj PII -> usuń lub zastąp -> sprawdź wynik.
- Rezultat: materiał bez zbędnych danych osobowych.
- Zabezpieczenie: minimalizacja danych i DLP.
Scenariusz 2: Analiza sprawy na podstawie opisu po anonimizacji
- Cel: analiza sprawy na podstawie opisu po anonimizacji.
- Wejście: tekst zawierający możliwe dane osobowe.
- Kroki: wykryj PII -> usuń lub zastąp -> sprawdź wynik.
- Rezultat: materiał bez zbędnych danych osobowych.
- Zabezpieczenie: minimalizacja danych i DLP.
Scenariusz 3: Automatyczne wykrywanie PII w tekście (DLP)
- Cel: automatyczne wykrywanie PII w tekście (DLP).
- Wejście: tekst zawierający możliwe dane osobowe.
- Kroki: wykryj PII -> usuń lub zastąp -> sprawdź wynik.
- Rezultat: materiał bez zbędnych danych osobowych.
- Zabezpieczenie: minimalizacja danych i DLP.
Typowe błędy i pułapki
- Wklejenie całego pisma z danymi do narzędzia zewnętrznego.
- Trzymanie promptów z danymi w historii narzędzia.
Ryzyka i jak je ograniczać
Ryzyko 1: Naruszenie prywatności
- Ryzyko: Naruszenie prywatności.
- Jak ograniczać: anonimizacja/pseudonimizacja.
Ryzyko 2: Wycieki
- Ryzyko: Wycieki.
- Jak ograniczać: DLP + polityka.
Ryzyko 3: Brak kontroli dostępu
- Ryzyko: Brak kontroli dostępu.
- Jak ograniczać: IAM/SSO.
Checklista “zanim użyjesz”
- Czy mogę usunąć dane osobowe?
- Czy mam podstawę prawną i zgodę procesu?
- Czy narzędzie jest zatwierdzone?
- Czy wynik nie ujawnia danych?
- Czy mam log i audyt?
Diagram
flowchart LR
A[Tekst lub dane]
B[Detekcja PII]
C[Anonimizacja]
D[Bezpieczniejsza analiza]
E[Wynik]
A --> B --> C --> D --> E
Diagram pokazuje, że dane osobowe powinny zostać wykryte i ograniczone przed użyciem ich w systemach AI.
Dalsza lektura
- RODO (ogólne zasady ochrony danych).
- UODO – materiały edukacyjne (Polska).
- NIST AI RMF (zarządzanie ryzykiem).
Miejsce w mapie
- PII → wymaga: Anonimizacja
- PII → chroni: DLP
- PII → powiązane z: RODO / DPIA