Datenschutz bei KI-Trainingsdaten: DSGVO und EU AI Act

Die Qualität von KI-Systemen hängt direkt von den Trainingsdaten ab. Gleichzeitig sind Trainingsdaten eine der größten Datenschutz-Herausforderungen beim KI-Einsatz. Sowohl DSGVO als auch EU AI Act stellen klare Anforderungen an den Umgang mit personenbezogenen Trainingsdaten.

Rechtsgrundlage für die Nutzung personenbezogener Trainingsdaten

Die Verwendung personenbezogener Daten für KI-Training ist nur mit einer gültigen DSGVO-Rechtsgrundlage zulässig: Einwilligung (Art. 6 Abs. 1 lit. a): Hohe Anforderungen, Widerrufbarkeit ist problematisch. Berechtigtes Interesse (Art. 6 Abs. 1 lit. f): Muss Interessenabwägung bestehen, Widerspruchsrecht beachten. Vertragserfüllung (Art. 6 Abs. 1 lit. b): Nur wenn Training für die Vertragserfüllung notwendig. Rechtliche Verpflichtung (Art. 6 Abs. 1 lit. c): Selten direkt anwendbar. Für besondere Datenkategorien (Gesundheit, Biometrie) braucht es zusätzlich eine Grundlage nach Art. 9 DSGVO.

EU AI Act-Anforderungen an Datensätze

Art. 10 EU AI Act stellt spezifische Anforderungen an Trainings-, Validierungs- und Testdaten für Hochrisiko-Systeme: Governance-Praktiken für Datenmanagement, Relevanz und Repräsentativität der Daten, Freiheit von Fehlern und Vollständigkeit, Berücksichtigung besonderer Merkmale des Einsatzkontexts, Erkennung und Behandlung von Datenlücken. Besonders wichtig: Art. 10 Abs. 5 erlaubt unter strengen Bedingungen die Verarbeitung besonderer Datenkategorien für Bias-Erkennung und -Korrektur.

Zweckbindung und Zweckänderung

Das DSGVO-Prinzip der Zweckbindung (Art. 5 Abs. 1 lit. b) ist bei Trainingsdaten besonders herausfordernd: Ursprünglicher Verarbeitungszweck (z.B. Kaufabwicklung) deckt KI-Training oft nicht ab. Art. 6 Abs. 4 DSGVO erlaubt Zweckänderung unter Abwägungskriterien. Praktische Empfehlung: Kommunizieren Sie KI-Trainingszwecke bereits bei der Ersterhebung der Daten, wenn absehbar. Anonymisierung oder Pseudonymisierung der Trainingsdaten kann Datenschutzrisiken erheblich reduzieren.

Rechte der Betroffenen bei Trainingsdaten

Betroffene Personen haben auch gegenüber KI-Trainingsdaten DSGVO-Rechte: Auskunftsrecht (Art. 15): Recht zu wissen, dass ihre Daten für KI-Training verwendet werden. Widerspruchsrecht (Art. 21): Bei berechtigtem Interesse als Rechtsgrundlage. Recht auf Vergessenwerden (Art. 17): Technisch schwierig bei trainierten Modellen (Machine Unlearning). Datenportabilität (Art. 20): Selten relevant für Trainingsdaten. Das Recht auf Vergessenwerden stellt Unternehmen vor technische Herausforderungen – Machine Unlearning ist ein aktives Forschungsfeld ohne vollständig befriedigende Lösungen.

Ist Ihr KI-System EU AI Act-konform?

Kostenlos prüfen in 10 Minuten — spezifisch für Ihr Unternehmen und Ihre Branche.

Jetzt Risiko prüfen →