1000+ Fünf-Sterne-Bewertungen und Top-Auszeichnungen machen uns zu einer der gefragtesten Lernplattformen.

maschke academy blog

Wissen. Technik. Kreativität.

Der offizielle Blog der Maschke Akademie: Updates, Tutorials und Insights aus der Welt der digitalen Bildbearbeitung, KI und visuellen Medien.

← Zurück zur Übersicht

Künstliche Intelligenz 27.04.2026

OpenAI Privacy Filter: OpenAI veröffentlicht lokales Tool zur Erkennung sensibler Daten

OpenAI Privacy Filter

ist ein lokal laufendes, KI‑basiertes Schutz‑Modell, das sensible personenbezogene Daten (PII) in Texten erkennt und unkenntlich macht, bevor diese an externe Dienste oder KI‑Modelle übermittelt werden.

Was der Privacy Filter leistet

Das Modell durchsucht Texte nach personenbezogenen Informationen wie Namen, Adressen, E‑Mails, Telefonnummern, Ausweis‑ und Kontodaten sowie nach Zugangsdaten, Passwörtern und API‑Schlüsseln.
Gefundene sensible Stellen können – je nach Einstellung – geschwärzt oder durch Platzhalter ersetzt werden, sodass nur eine bereinigte Version weitergegeben wird.
Verschiedene Arten sensibler Daten (z.B. Kontakt‑, Finanz‑, Gesundheits‑ oder Log‑/Technik‑Daten) werden getrennt erkannt, um gezielter zu filtern als mit einfachen Muster‑Suchen oder regulären Ausdrücken.

Architektur und technische Grundlagen

Beim Privacy Filter handelt es sich um ein Open‑Weights‑Modell mit rund 1,5 Milliarden Parametern, das nach dem Mixture‑of‑Experts‑Prinzip arbeitet, wodurch immer nur ein Teil des Modells aktiv ist und die Hardware‑Anforderungen sinken.
Es fungiert als bidirektionales Token‑Klassifikationsmodell mit sehr großem Kontextfenster, sodass auch lange Dokumente wie Verträge, E‑Mail‑Verläufe oder Protokolle in einem Durchlauf geprüft werden können.
Das Modell ist darauf ausgelegt, auf normalen Rechnern oder im Browser mit moderner GPU‑Unterstützung zu laufen und lässt sich lokal in bestehende Daten‑Workflows integrieren.

Qualität und Grenzen

In internen Tests erreicht der Privacy Filter eine hohe Erkennungsrate und Genauigkeit bei der Identifikation personenbezogener Daten und anderer Geheimnisse.
Trotzdem wird ausdrücklich betont, dass das Modell keine absolute Sicherheit gewährleistet – vor allem nicht in hochsensiblen Bereichen wie Medizin, Finanzwesen oder jurischen Spezialfällen.
Es soll daher als zusätzliche Schutzschicht verstanden werden, die mit bestehenden Compliance‑Prozessen, Richtlinien und technischen Kontrollen kombiniert wird.

Lizenz, Einsatz und Zielgruppe

Der Privacy Filter wird mitsamt Gewichten, Dokumentation und Hilfswerkzeugen veröffentlicht, sodass er lokal in eigenen Anwendungen genutzt werden kann.
Ein mitgeliefertes Kommandozeilen‑Werkzeug ermöglicht es, Texte zu scannen und zu bereinigen und diese Schritte in Skripte, ETL‑Pipelines oder Log‑Verarbeitung einzubauen.
Besonders interessant ist das für Unternehmen und Institutionen in streng regulierten Bereichen, die KI‑Dienste einsetzen wollen, ohne rohe Kundendaten oder interne Inhalte aus der eigenen Infrastruktur herauszugeben.

Typisches Einsatzszenario

Du lässt eingehende E‑Mails, Tickets oder Chat‑Verläufe zunächst lokal durch den Privacy Filter laufen, der Personen‑ und Kontaktdaten sowie sensible Identifikatoren maskiert.
Erst die bereinigte Fassung wird anschließend von einem großen Sprachmodell analysiert, etwa für Zusammenfassungen, Klassifikationen oder Antwortvorschläge.
Die Originaldaten bleiben in deinem System, und alle nach außen gehenden Inhalte enthalten nur noch anonymisierte oder pseudonymisierte Informationen.