
In NGOs und Vereinen zögern viele von euch beim Einsatz von KI-Tools weil sie unsicher mit dem Datenschutz sind. Die meisten glauben auch, dass sie KI trainieren, wenn sie Daten eingeben. Das stimmt zwar so nicht, aber dennoch ist der Datenschutz bei KI-Systemen wirklich schwierig.
Deshalb hier die Basics zum Verstehen der verschiedenen technischen Ebenen und meine drei Vorgehensweisen als Video und im Kurz-Beitrag.
(Ich bin keine Juristin und dies ist keine Rechtsberatung.)
1. Der selektive Ansatz: Keine sensiblen Daten teilen
Die meisten KI-Tools wie ChatGPT speichern Eingaben in amerikanischen Clouds. Ohne rechtsgültige Auftragsverarbeitung haben personenbezogene und sensible Daten dort nichts verloren. Selbst wenn Tools wie ChatGPT die Option bieten, das Training mit deinen Daten zu deaktivieren, ändert das nichts an der fehlenden Auftragsverarbeitung.
Meine Faustregel: Gib nur Daten ein, die auch öffentlich werden dürften.
2. Ein bisschen mehr Datenschutz: Europäische Hosting-Lösungen
Da ihr mit euren Daten nie direkt KI trainiert (sondern nur Kontext liefert), lassen sich die Clouds auch sicher ein Europa/D nutzen. (Mehr zur Funktionsweise und dem Nicht-Training lest ihr in meinem Blogbeitrag: Die 3 größten Irrtümer über KI.)
Ein paar Anbieter bieten euch dieses Hosting an: Z.B. Fobizz, Langdock, Nele.ai, ggf. auch Copilot oder ChatGPT Enterprise. Wenn ihr mit sensiblen oder personenbezogenen Daten arbeiten wollt, müsst ihr solche Tools auf Herz und Nieren mit euren Datenschutzbeauftragten checken. Denn unter diesen Tools werden weiterhin große Sprachmodelle in der Regel in US-amerikanischen Clouds eingesetzt, auch wenn diese eure Daten nicht nutzen dürfen.
3. Die Königsklasse: Eigene Modelle auf eigenen Servern

Die sicherste – aber auch aufwändigste – Lösung ist das Hosting eigener KI-Modelle. Dank OpenSource-Lösungen wie Llama oder Mixtral ist dies inzwischen realistisch. Diese Modelle kommen in den Fähigkeiten nämlich immer besser an die kommerziellen Angebote wie ChatGPT oder Claude heran.
Die Herausforderung für das Hosting liegt im Ressourcenbedarf: Eigene Modelle benötigen leistungsstarke Server und die Administration dann auch technische Fachkenntnis. Allerdings entwickeln sich immer mehr kleinere Modelle, die dann auch auf dem eigenen Rechner oder kleinen Server betrieben werden und viele Alltagsaufgaben gut bewältigen. Checkt dazu z.B. mal https://www.nomic.ai/gpt4all.
Mein Traum: Ich hoffe, dass wir uns bald als zivilgesellschaftliche Akteure zusammentun, um gemeinsam große, flexible Modelle zu betreiben – sicher und transparent. Das würde den KI-Einsatz in sensiblen Bereichen revolutionieren!
Meine praktische Lösung: Kombination aus Ansatz 1 und 2
In meiner täglichen Arbeit verbinde ich die ersten beiden Strategien: Ich verzichte auf die Eingabe sensibler Daten und nutze Hosting-Lösungen, die meinen Datenschutzanforderungen entsprechen. Dabei teile ich keine besonders sensiblen Daten.
P.S. Eine Vorlage für entsprechende KI-Leitlinien für Vereine habe ich auch geschrieben:
www.juliajunge.de/leitlinien
Mehr verstehen

Möchtest du dich vertiefen und lernen, wie du KI sicher und effektiv in deinem Team einsetzen kannst? Dann komm doch gern zu einem meiner Kurse:
- KI-Camp für Teams: Der Crash-Kurs für den Start in Generative KI
- KI-Flüstern für Multiplikator*innen: Werde zur KI-Expert*in in deiner Organisation
- oder ein Einstiegs-Workshop gefällig?
Wie gehst du mit Datenschutz um?
Diskutiere mit mir auf Linkedin oder schreib mir eine Mail. Ich freu mich auf den Austausch.