Was mit deinen Daten passiert, bevor eine KI sie sieht.
Wer sieht dabei meine Daten? Die ehrliche Antwort: Ein externes KI-Modell muss deine Kundennamen und Zahlen gar nicht zu Gesicht bekommen. Entweder bleibt alles lokal bei dir, oder es wird vorher anonymisiert.
Müller AG[Firma]thomas@…[E-Mail]CH93 0076 …[IBAN]Feste Angaben sind leicht zu schützen.
Manche Daten sind leicht zu schützen, weil sie ein festes Muster haben. Eine E-Mail-Adresse, eine IBAN, eine AHV-Nummer, eine Telefonnummer: Solche Angaben folgen immer demselben Aufbau. Die erkennt das System über feste, eingebaute Muster, zuverlässig und immer gleich (deterministisch heisst nichts anderes als: dieselbe Eingabe ergibt immer dasselbe Ergebnis, kein Raten). Das ist der stabile Kern. Hier gibt es keine Überraschungen.
Und diese Muster sind nicht in Stein gemeisselt. Hat dein Betrieb eigene feste Kennungen, etwa Mandanten- oder Fallnummern beim Treuhänder, Auftrags- oder Kundennummern im Handwerk, eine Patienten- oder Policennummer, baue ich die Erkennung gezielt darauf aus. Die Anonymisierung wird an deine Daten angepasst, nicht umgekehrt.
Über Muster zuverlässig erkannt
- IBAN
- AHV-Nummer
- Telefon
Deine Daten bleiben geschützt, auf zwei Arten.
Damit ein KI-Modell deine Daten nicht im Klartext sieht, gibt es zwei Wege. Welcher passt, hängt von deinem Fall ab. Das entscheiden wir gemeinsam, nicht du allein.
Weg A: lokales Modell
Der erste Weg ist ein lokales Modell. Die Daten verlassen das Haus nie. Sie bleiben auf einem Rechner bei dir im Haus, den du kontrollierst. Das ist der stärkste Schutz. Der Preis dafür: Ein lokales Modell ist schwächer als die grossen Cloud-Modelle, und der Betrieb ist teurer.
Weg B: Cloud mit Anonymisierung
Der zweite Weg ist ein starkes Cloud-Modell, aber mit einem Anonymisierungs-Schritt davor. Bevor der Text das Haus verlässt, werden Namen und Zahlen durch Platzhalter ersetzt. Der Anbieter sieht also „[Name]“ oder „[Betrag]“, nie deinen echten Kunden. So bekommst du die beste Qualität, ohne die echten Daten herzugeben.
Mein Anspruch dahinter: Du sollst nicht zwischen guter KI und gutem Datenschutz wählen müssen.
Kurz und ehrlich, wie ich dahin kam.
Klingt einfach, war es nicht. Ich nehme nicht das erste Werkzeug vom Regal. Gerade das Anonymisieren von Namen ist heikel, denn ein Werkzeug, das Bern für einen Namen hält oder März für einen Nachnamen, ist nutzlos. Für die Namenserkennung habe ich darum nacheinander drei Ansätze getestet, bis einer präzise genug war: zuerst ein lokales deutsches Sprachmodell, dann den Industrie-Standard Microsoft Presidio, schliesslich ein mehrsprachiges Modell namens GLiNER. Entscheidend war, dass ich den Motor darunter austauschen konnte, ohne dass sich aussen am Betrieb etwas änderte.
Der Aufwand hatte einen Grund: Die fertigen Standard-Werkzeuge markierten zu oft Harmloses als Personennamen. In meinem Stresstest fielen genau solche Fälle auf: der Ort Bern, der Monat März, die Firma Müller AG, der Vorname Thomas allein im Satz. Derselbe Test fand auch eine echte Lücke: Telefonnummern im internationalen Format (+41 oder 0041) wurden zuerst nicht erkannt. Behoben und einen Test ergänzt, damit der Fehler nicht zurückkommt. Für das Zusammenspiel mit einer Wissensbasis sitzt zusätzlich eine Sicherung drin: Lässt sich ein Platzhalter am Ende nicht mehr sicher durch den echten Wert ersetzen, warnt das System, statt etwas Falsches einzusetzen. Es rät nicht.
Die drei Ansätze, nacheinander
- 01Lokales deutsches Sprachmodell
- 02Microsoft Presidio
- 03GLiNER
Ganz ohne Restrisiko geht es nicht, und das sage ich lieber offen. Namenserkennung ist nie zu hundert Prozent zuverlässig. Die eine Richtung ist dabei harmlos: Wird einmal ein Wort zu viel anonymisiert, ist das nur unnötig, nicht gefährlich. Die andere Richtung ist das eigentliche Risiko, einen Namen zu übersehen. Darum gilt bei besonders sensiblen Daten eine klare Regel: Entweder gibt ein Mensch den Text vor dem Versand frei, oder es wird gar kein externes Modell genutzt und alles bleibt lokal.
Datensicherheit ist bei mir kein Häkchen auf einer Liste, sondern Teil der Bauweise. Willst du wissen, welcher Weg zu deinem Betrieb passt, reden wir darüber, bevor irgendetwas gebaut wird.
Den rechtlichen Pflichttext findest du in der Datenschutzerklärung.
Häufige Fragen zur Datensicherheit
Kurz und ehrlich beantwortet. Fehlt eine Frage? Dann stell sie direkt.
01Sieht der KI-Anbieter meine Kundendaten?+
Nicht im Klartext. Beim Cloud-Weg werden Namen und Zahlen vor dem Versand durch Platzhalter ersetzt. Der Anbieter sieht „[Name]“ statt deines echten Kunden. Beim lokalen Weg verlassen die Daten das Haus überhaupt nicht.
02Was passiert mit Namen und Zahlen in einem Dokument?+
Feste Angaben wie E-Mail, IBAN, AHV-Nummer und Telefonnummer werden über eingebaute Muster zuverlässig erkannt und ersetzt. Namen sind schwieriger. Dafür nutze ich ein eigens ausgewähltes Erkennungs-Modell. Bleibt ein Platzhalter unsicher, warnt das System, statt zu raten.
03Bleiben die Daten in der Schweiz?+
Beim lokalen Weg ja. Dort bleibt alles auf einem Rechner bei dir im Haus, nichts geht nach aussen. Beim Cloud-Weg verlassen nur Platzhalter das Haus, keine echten Personendaten. Soll auch die übrige Verarbeitung strikt in der Schweiz bleiben, läuft das über den lokalen Weg oder einen Anbieter mit Datenhaltung in der Schweiz oder der EU. Was in deinem Fall gilt, halten wir vor dem Bau schriftlich fest.