Effiziente Datenpflege mit KI

Effiziente Datenpflege mit KI Worauf es bei der Pflege von Adressen und anderen Daten ankommt

Crossmediale Kommunikation lebt von hochwertigen Daten – und diese müssen gepflegt werden. Denn ohne regelmässige Aktualisierung veralten gerade Adressdaten rasch. Mit künstlicher Intelligenz eröffnen sich neue Wege, Daten effizient zu prüfen, zu bereinigen und zu pflegen.

Jemand bedient mit einem Tablet einen KI-Assistenten
Künstliche Intelligenz eignet sich besonders gut für komplexe Aufgaben der Datenpflege.

Datengetriebene Werbung wirkt stärker. Deshalb setzen Marketingteams verschiedene Tools ein, um Informationen über die Kundschaft, deren Verhalten und die Wirkung von Werbemassnahmen zu sammeln. Das Problem ist nur: Viele Unternehmen verlieren rasch den Überblick und finden sich in einer Datenflut wieder. Die eigentlich wertvollen Informationen liegen dann verstreut in Datensilos, werden weder zusammengeführt noch gepflegt – und veralten mit der Zeit. So entpuppt sich der vermeintliche Datenschatz schnell als wertlos.

Besonders deutlich zeigt sich das bei Adressdaten. Denn diese sind kurzlebig: Laut Bundesamt für Statistik ziehen jedes Jahr rund zehn Prozent der Personen in der Schweiz um. Hinzu kommen geänderte Strassennamen sowie zahlreiche Namensänderungen durch Eheschliessungen oder Scheidungen. Und im B2B-Bereich sorgen zum Beispiel Stellenwechsel oder Firmenschliessungen dafür, dass Adressdaten rasch an Qualität verlieren. Die Folge: Werbekampagnen, die die Vorteile physischer und digitaler Kanäle kombinieren, können ihr Potenzial nicht voll ausschöpfen.

Hochwertige Daten als Erfolgsfaktor

Nur mit aktuellen und korrekten Daten lassen sich Konsumierende entlang der Customer Journey begleiten und zu einem Kauf führen. Diese Daten sind die Grundlage, um Botschaften präzise auszuspielen und ihre Wirkung über alle Kanäle hinweg zu verstärken. Hochwertige Daten bieten folgende Vorteile für die crossmediale Kommunikation:

Personalisierte Inhalte
Anpassungen in Echtzeit
Stärkere crossmediale Wirkung
Besseres Kundenerlebnis
Stärkere Kundenbindung
Bessere Entscheidungsgrundlagen

Wie lässt sich die Datenpflege effizient gestalten?

Mit den richtigen Technologien läuft die Datenpflege heute deutlich effizienter ab als früher. Softwarelösungen automatisieren Routinetätigkeiten, die sonst viel Handarbeit erfordern würden. Zudem stellen sie sicher, dass die Daten schon nach einheitlichen Vorgaben erfasst werden. Das sind typische Funktionen, die die Effizienz der Datenpflege erhöhen:

  • Standardisierung von Formaten: Die Software macht für die Erfassung von Daten wie Strassennamen, Telefonnummern, Postleitzahlen oder Geburtsdaten klare Vorgaben damit die Daten ein einheitliches Format haben.
  • Echtzeit-Validierung bei der Eingabe: Die Software prüft zum Beispiel, ob Pflichtfelder ausgefüllt sind und ob Angaben wie Postleitzahlen oder Telefonnummern plausibel sind.
  • Dublettenerkennung: Datenpflege-Tools finden identische Datensätze und führen sie zusammen. Das verhindert Mehrfachversände und spart Kosten.
  • Abgleich mit Referenzdatenbanken: Der regelmässige Abgleich der eigenen Daten mit Referenzdatenbanken – zum Beispiel von Adressdienstleistern – sorgt dafür, dass Adressen aktuell bleiben.
  • Batch-Verarbeitung: Statt einzelne Datensätze manuell zu prüfen, können ganze Bestände in einem Durchlauf geprüft und bereinigt werden – bei Tausenden von Datensätzen ein enormer Zeitgewinn.
  • Integration in bestehende Systeme: Viele Lösungen für die Datenpflege lassen sich über Schnittstellen an CRM-, ERP- oder Marketing-Plattformen anbinden, was die Automatisierung von Kontrollprozessen ermöglicht.

Onlinekurs «Adressmanagement»

Adressen sind der Schlüssel zu Ihren Kunden. Im Onlinekurs «Adressmanagement» erfahren Sie in vier Kursteilen, wie Sie mehr aus Ihren Daten herausholen. Sie erhalten zahlreiche Planungshilfen sowie nützliche Tipps um Adressen, Kundendaten und Zielgruppen erfolgreich zu managen.

Jetzt gratis anmelden

Höhere Datenqualität durch KI

«Klassische Tools für die Datenpflege arbeiten regelbasiert», erklärt Lisa Nagel, Daten- und KI-Strategin bei Data Value Creation. «Damit sie funktionieren, müssen starre Regeln definiert werden – etwa: Eine Postleitzahl in der Schweiz hat vier Ziffern.» Bei komplexeren Aufgaben stossen solche Systeme jedoch schnell an ihre Grenzen.

KI-Tools hingegen verfügen über ein semantisches Verständnis von Daten. Oder wie es Lisa Nagel formuliert: «Sie erkennen Kontext, inhaltliche Zusammenhänge – und vor allem Muster. Deshalb können sie nicht nur harte, regelbasierte Fehler korrigieren, sondern auch weiche Unstimmigkeiten erkennen: zum Beispiel Tippfehler, unterschiedliche Schreibweisen oder unplausible Kombinationen. Das nennt man Fuzzy Matching.»

Damit eignen sich KI-gestützte Lösungen besonders gut für komplexe Aufgaben der Datenpflege. Sechs Beispiele zeigen, wie das in der Praxis aussieht:

1. Schwierige Dubletten erkennen und zusammenführen

«KI-Modelle identifizieren in Datenbanken auch komplexe Dubletten», erklärt Shkumbin Sadriu, Data & Analytics Product Manager, Swiss Post Advertising. Das sind jene doppelten Einträge, «die erst auf den zweiten Blick als Dublette zu erkennen sind, weil die Schreibweisen zu stark voneinander abweichen.» Ein Beispiel für eine solche Dublette: Karin & Rüedu Müller und Ruedi Müller.

Hier schlägt die KI eine Zusammenführung vor oder macht diese gleich selbst. «In der Praxis definiert man dafür einen Minimalwert für die Übereinstimmung: Sind zwei Datensätze zu mindestens 80 Prozent identisch, werden sie automatisch zusammengeführt. Bei weniger als 80 Prozent werden sie zur weiteren Überprüfung und zur Verbesserung des Modells markiert», so Shkumbin Sadriu.

Datenschutz: Warum KI eine Stolperfalle ist

2. Unstrukturierte Daten nutzbar machen

Ein grosser Teil der Unternehmensdaten liegt in unstrukturierter Form vor – in E-Mails, Kundenfeedbacks, Support-Tickets oder Rezensionen. KI-basierte Sprachverarbeitung (Natural Language Processing) kann aus solchen Texten wichtige Informationen extrahieren – neben Namen und Adressen genauso Anliegen und Bedürfnisse dieser Personen – und sie in strukturierte Datensätze umwandeln. Damit wird ein bislang schwer nutzbarer Datenpool für Analysen und Kampagnen zugänglich. Im Fall von E-Mail-Autosignaturen lassen sich die Informationen auch direkt für die Datenpflege nutzen.

3. Daten standardisieren

«KI kann helfen, Daten zu vereinheitlichen, indem sie Ähnlichkeiten und unterschiedliche Schreibweisen erkennt, die denselben Sachverhalt meinen», erklärt Alexander Rieder, Leiter Produktmanagement Kundenbezogene Daten bei Swiss Post Advertising. So wird aus Zuerich, Zürich, zurich und ZH einheitlich Zürich – und aus Telefonnummern wie +41795550033 oder 079 555 00 33 das standardisierte Format +41 79 555 00 33.

4. Muster erkennen

KI-Systeme sind besonders stark darin, Muster und Zusammenhänge in grossen Datenmengen zu erkennen – und das bietet gegenüber regelbasierten Ansätzen grosse Vorteile. «Wenn wir versuchen würden, ausschliesslich mit festen Regeln zu bestimmen, was ein Familienhaushalt und was eine WG ist, würden wir viele Fälle falsch einordnen», erklärt Shkumbin Sadriu. «Ein entsprechendes KI-Modell hingegen analysiert Datensätze in ihrer Gesamtheit, erkennt darin übereinstimmende Muster – etwa Altersstrukturen, Nachnamen oder Konsumverhalten – und kann dadurch unvoreingenommener kategorisieren.»

5. Datenintegration optimieren

Unternehmen erfassen heute eine Vielzahl von Daten aus unterschiedlichen Quellen. KI-Tools sind in der Lage, die Datensätze zusammenzuführen und ihre Struktur zu vereinheitlichen – ein wichtiger Schritt hin zu einer konsolidierten Datenbasis.

6. Anomalien erkennen

Auffälligkeiten in Daten sind oft schwer zu erkennen, gerade in grossen Beständen. KI-Modelle identifizieren unplausible Werte: etwa eine Hausnummer, die es in der Strasse gar nicht gibt, oder eine E-Mail-Adresse mit unbekannter Domain. Auch widersprüchliche Datensätze – derselbe Kunde einmal mit Adresse in Zürich, einmal in Genf – entdeckt sie automatisiert. «Das hilft nicht nur, Fehler schneller zu erkennen und zu korrigieren, sondern entlarvt sogar potenziell betrügerische Angaben», so Alexander Rieder.

Fraud Prevention: Missbrauch mit Adressdaten verhindern

Grenzen der Datenpflege mit KI

Das grösste Risiko in der KI-gestützten Datenpflege ist das blinde Vertrauen in die Technologie. «Viele vergessen, dass KI-Modelle nicht deterministisch arbeiten – sie liefern Wahrscheinlichkeiten, keine Gewissheiten», warnt Lisa Nagel. «Wer die Ergebnisse ungeprüft übernimmt, läuft Gefahr, falsche Schlüsse zu ziehen oder fehlerhafte Datensätze zu übernehmen. Dem kann man mit Stichprobenkontrollen in den Fachabteilungen entgegenwirken. Denn diese verfügen über das nötige Wissen, um beurteilen zu können, ob eine Korrektur der KI plausibel ist.»

Zudem gilt: Eine KI kann nur dann zuverlässig arbeiten, wenn sie die unternehmensspezifischen Logiken kennt. Als Beispiel nennt Lisa Nagel ein Schifffahrtsunternehmen, das jedes Containerschiff im CRM-System als eigene Firma erfasst, obwohl alle Schiffe zur gleichen Reederei gehören. «Wenn die KI diese Logik nicht kennt, würde sie die Einträge als Dubletten einstufen und löschen. Man muss sie also instruieren und ihr die betriebliche Logik erklären.»

Auch die Trainingsdaten können zum Problem werden. Shkumbin Sadriu gibt zu bedenken: «KI-Modelle lernen aus den Trainingsdaten, die ihnen zur Verfügung gestellt werden. Unternehmen müssen sich bewusst sein, dass Trainingsdaten Verzerrungen enthalten können. Angenommen, die KI definiert eine Familie aufgrund der Datenbasis als eine Gruppe bestehend aus Mutter, Vater und mindestens einem Kind. Dann würden Alleinerziehende oder gleichgeschlechtliche Paare mit Kindern nicht als Familie erkannt. Hier geht es also schnell auch um Fragen der Datenethik.»

Doch wie lässt sich dieses Problem lösen? «Zum einen durch kritisches Hinterfragen – sowohl der KI-Ergebnisse als auch der eigenen Denkmuster», so Alexander Rieder. «Mitarbeitende müssen für mögliche Verzerrungen sensibilisiert werden. Zum anderen helfen eine sorgfältige Auswahl und eine laufende Überprüfung der Trainingsdaten. Denn ein Bias entsteht oft durch einseitige oder historisch geprägte Datenquellen.»

Adressdaten systematisch pflegen

So leistungsfähig KI-gestützte Tools auch sind: Gerade bei den Adressdaten sollten Sie trotzdem nicht auf die Unterstützung spezialisierter Dienstleister verzichten. Denn KI ersetzt weder den Abgleich mit laufend aktualisierten Referenzdaten noch das Fachwissen, das für eine dauerhaft hohe Datenqualität nötig ist. Adressdienstleister wie die Post sind immer auf dem neusten Stand, was Umzüge, Namensänderungen oder neue Strassennamen betrifft, und beraten Sie rund um die Adresspflege. Sie bieten Ihnen unter anderem die folgenden Dienstleistungen an:

Adressanalyse und -aktualisierung: Wenn Sie regelmässig adressierte Mailings verschicken, ist es unerlässlich, Ihren Adressstamm vor jedem Versand zu aktualisieren. Bei der Adressprüfung durch einen Adressdienstleister wird die Gültigkeit von Personen- oder Firmenadressen überprüft. Enthält Ihre Datenbank veraltete, fehlerhafte oder ungültige Daten, können Sie vom Adressdienstleister die korrigierten Adressen beziehen.

Abgleich mit Sterberegister: Manche Adressdienstleister führen ein Sterberegister, mit dem Sie Ihren Adressstamm abgleichen können. So vermeiden Sie es, dass Hinterbliebene von Ihnen Post für die verstorbene Person erhalten.

Adresspflege durch Experten: Wollen Sie aufgrund Ihrer knappen Ressourcen die gesamte Adresspflege auslagern? Dann können Sie alle Aufgaben den Fachleuten eines Adressdienstleisters überlassen. Sie bereinigen, aktualisieren und verifizieren Ihre Adressen nach Bedarf.

Adressen nachforschen: Haben Sie Adressen wichtiger Kundinnen oder Spender verloren? Oder liegt der letzte Kontakt lange zurück? Dann können Sie auf den Suchservice eines Adressdienstleisters zurückgreifen. Bei dieser Recherche werden Ihre Daten mit internen und externen Quellen aus dem In- und Ausland abgeglichen.

Welche Folgen haben fehlerhafte Adressdaten?

Fehlerhafte Adressdaten bringen gleich mehrere Probleme mit sich:

  • Wichtige Sendungen wie Verträge oder Rechnungen kommen nicht an
  • Streuverluste und schlechtere Erfolgskennzahlen durch unzustellbare Werbesendungen
  • Unnötige Kosten für doppelte Sendungen
  • Hoher Aufwand für das Verarbeiten von Retouren
  • Reputationsschaden: Fehlerhafte Adressen werden als mangelnde Wertschätzung empfunden

Lisa Nagel

ist Daten- und KI-Strategin bei Data Value Creation.
(Bild: Marie Pietruschka)

Portrait Lisa Nagel (© Marie Pietruschka)

Shkumbin Sadriu

ist Data & Analytics Product Manager bei Swiss Post Advertising.

Portrait Shkumbin Sadriu

Alexander Rieder

ist Leiter Produktmanagement Kundenbezogene Daten bei Swiss Post Advertising.

Portrait Alexander Rieder

Stimmen Ihre Adressen noch?

10 Prozent der Schweizer Bevölkerung ziehen jährlich um. Sie wissen selbst, wie schnell Ihre Kundendatenbank deshalb veraltet. Gerne zeigen wir Ihnen, wie Sie Ihre Adressen überprüfen und aktualisieren können – damit Sie den Kontakt zu Ihren Kundinnen und Kunden nicht verlieren.

Ich will mich beraten lassen