Effiziente Datenpflege mit KI Worauf es bei der Pflege von Adressen und anderen Daten ankommt
Crossmediale Kommunikation lebt von hochwertigen Daten – und diese müssen gepflegt werden. Denn ohne regelmässige Aktualisierung veralten gerade Adressdaten rasch. Mit künstlicher Intelligenz eröffnen sich neue Wege, Daten effizient zu prüfen, zu bereinigen und zu pflegen.
Datengetriebene Werbung wirkt stärker. Deshalb setzen Marketingteams verschiedene Tools ein, um Informationen über die Kundschaft, deren Verhalten und die Wirkung von Werbemassnahmen zu sammeln. Das Problem ist nur: Viele Unternehmen verlieren rasch den Überblick und finden sich in einer Datenflut wieder. Die eigentlich wertvollen Informationen liegen dann verstreut in Datensilos, werden weder zusammengeführt noch gepflegt – und veralten mit der Zeit. So entpuppt sich der vermeintliche Datenschatz schnell als wertlos.
Besonders deutlich zeigt sich das bei Adressdaten. Denn diese sind kurzlebig: Laut Bundesamt für Statistik ziehen jedes Jahr rund zehn Prozent der Personen in der Schweiz um. Hinzu kommen geänderte Strassennamen sowie zahlreiche Namensänderungen durch Eheschliessungen oder Scheidungen. Und im B2B-Bereich sorgen zum Beispiel Stellenwechsel oder Firmenschliessungen dafür, dass Adressdaten rasch an Qualität verlieren. Die Folge: Werbekampagnen, die die Vorteile physischer und digitaler Kanäle kombinieren, können ihr Potenzial nicht voll ausschöpfen.
Hochwertige Daten als Erfolgsfaktor
Nur mit aktuellen und korrekten Daten lassen sich Konsumierende entlang der Customer Journey begleiten und zu einem Kauf führen. Diese Daten sind die Grundlage, um Botschaften präzise auszuspielen und ihre Wirkung über alle Kanäle hinweg zu verstärken. Hochwertige Daten bieten folgende Vorteile für die crossmediale Kommunikation:
Mithilfe von Daten lassen sich Inhalte passgenau auf Interessen, Bedürfnisse und bevorzugte Kanäle von Zielgruppen, Segmenten oder sogar einzelnen Personen ausrichten.
Zusätzlich zur Personalisierung können Inhalte sogar in Echtzeit angepasst werden – abgestimmt auf das individuelle Verhalten der Nutzerinnen und Nutzer.
Die grösste Werbewirkung entsteht, wenn Werbebotschaften die Zielgruppe über mehrere Online- und Offlinekanäle entlang der gesamten Customer Journey erreichen – am richtigen Ort und vor allem im richtigen Moment. Die Basis dafür sind personen-, interessens-, ereignis- und ortsbezogene Daten.
Wer auf mehreren Kanälen mit einem Unternehmen interagiert, schätzt ein nahtloses Erlebnis: Egal, an welchem Touchpoint die Kundinnen und Kunden ihre Customer Journey fortsetzen – die Daten der vorherigen Interaktionen sind hinterlegt. Dadurch ist eine hohe Konvergenz in der Werbung möglich: Die Kundinnen und Kunden werden mit dem passenden Angebot genau dort angesprochen, wo sie sich gerade befinden.
Durch das Verständnis von Kundenverhalten und -bedürfnissen können Unternehmen individuelle Angebote entwickeln, die Wiederkäufe, Markentreue und Empfehlungen fördern und den Kundenwert steigern.
Predictive Analytics nutzt Daten, um Muster im Kundenverhalten zu erkennen und Prognosen für künftige Aktionen abzuleiten. Unternehmen können damit besser einschätzen, wie die Kundschaft auf eine Kampagne reagiert, welche Zielgruppen besonders lukrativ sind oder welche Produkte am besten angeboten werden sollten.
Wie lässt sich die Datenpflege effizient gestalten?
Mit den richtigen Technologien läuft die Datenpflege heute deutlich effizienter ab als früher. Softwarelösungen automatisieren Routinetätigkeiten, die sonst viel Handarbeit erfordern würden. Zudem stellen sie sicher, dass die Daten schon nach einheitlichen Vorgaben erfasst werden. Das sind typische Funktionen, die die Effizienz der Datenpflege erhöhen:
- Standardisierung von Formaten: Die Software macht für die Erfassung von Daten wie Strassennamen, Telefonnummern, Postleitzahlen oder Geburtsdaten klare Vorgaben damit die Daten ein einheitliches Format haben.
- Echtzeit-Validierung bei der Eingabe: Die Software prüft zum Beispiel, ob Pflichtfelder ausgefüllt sind und ob Angaben wie Postleitzahlen oder Telefonnummern plausibel sind.
- Dublettenerkennung: Datenpflege-Tools finden identische Datensätze und führen sie zusammen. Das verhindert Mehrfachversände und spart Kosten.
- Abgleich mit Referenzdatenbanken: Der regelmässige Abgleich der eigenen Daten mit Referenzdatenbanken – zum Beispiel von Adressdienstleistern – sorgt dafür, dass Adressen aktuell bleiben.
- Batch-Verarbeitung: Statt einzelne Datensätze manuell zu prüfen, können ganze Bestände in einem Durchlauf geprüft und bereinigt werden – bei Tausenden von Datensätzen ein enormer Zeitgewinn.
- Integration in bestehende Systeme: Viele Lösungen für die Datenpflege lassen sich über Schnittstellen an CRM-, ERP- oder Marketing-Plattformen anbinden, was die Automatisierung von Kontrollprozessen ermöglicht.
Höhere Datenqualität durch KI
«Klassische Tools für die Datenpflege arbeiten regelbasiert», erklärt Lisa Nagel, Daten- und KI-Strategin bei Data Value Creation. «Damit sie funktionieren, müssen starre Regeln definiert werden – etwa: Eine Postleitzahl in der Schweiz hat vier Ziffern.» Bei komplexeren Aufgaben stossen solche Systeme jedoch schnell an ihre Grenzen.
KI-Tools hingegen verfügen über ein semantisches Verständnis von Daten. Oder wie es Lisa Nagel formuliert: «Sie erkennen Kontext, inhaltliche Zusammenhänge – und vor allem Muster. Deshalb können sie nicht nur harte, regelbasierte Fehler korrigieren, sondern auch weiche Unstimmigkeiten erkennen: zum Beispiel Tippfehler, unterschiedliche Schreibweisen oder unplausible Kombinationen. Das nennt man Fuzzy Matching.»
Damit eignen sich KI-gestützte Lösungen besonders gut für komplexe Aufgaben der Datenpflege. Sechs Beispiele zeigen, wie das in der Praxis aussieht:
1. Schwierige Dubletten erkennen und zusammenführen
«KI-Modelle identifizieren in Datenbanken auch komplexe Dubletten», erklärt Shkumbin Sadriu, Data & Analytics Product Manager, Swiss Post Advertising. Das sind jene doppelten Einträge, «die erst auf den zweiten Blick als Dublette zu erkennen sind, weil die Schreibweisen zu stark voneinander abweichen.» Ein Beispiel für eine solche Dublette: Karin & Rüedu Müller und Ruedi Müller.
Hier schlägt die KI eine Zusammenführung vor oder macht diese gleich selbst. «In der Praxis definiert man dafür einen Minimalwert für die Übereinstimmung: Sind zwei Datensätze zu mindestens 80 Prozent identisch, werden sie automatisch zusammengeführt. Bei weniger als 80 Prozent werden sie zur weiteren Überprüfung und zur Verbesserung des Modells markiert», so Shkumbin Sadriu.
Heute ist die Verlockung gross, Kundendaten mal schnell von einer generativen KI prüfen zu lassen. Doch das ist heikel, mahnt Lisa Nagel: «Kundendaten gehören nicht in freie KI-Modelle – vor allem nicht im B2C-Kontext. Denn dabei handelt es sich immer um personenbezogene Daten, die besonders schützenswert sind.»
Stattdessen empfiehlt sie, nur mit sicheren, geschlossenen Modellen zu arbeiten: «Unternehmen sollten zuerst prüfen, welche Möglichkeiten ihre bestehenden Systeme bereits bieten, bevor sie weitere externe Tools anbinden. Viele CRM-Systeme verfügen mittlerweile über integrierte KI-Funktionen zur Adressprüfung.»
2. Unstrukturierte Daten nutzbar machen
Ein grosser Teil der Unternehmensdaten liegt in unstrukturierter Form vor – in E-Mails, Kundenfeedbacks, Support-Tickets oder Rezensionen. KI-basierte Sprachverarbeitung (Natural Language Processing) kann aus solchen Texten wichtige Informationen extrahieren – neben Namen und Adressen genauso Anliegen und Bedürfnisse dieser Personen – und sie in strukturierte Datensätze umwandeln. Damit wird ein bislang schwer nutzbarer Datenpool für Analysen und Kampagnen zugänglich. Im Fall von E-Mail-Autosignaturen lassen sich die Informationen auch direkt für die Datenpflege nutzen.
3. Daten standardisieren
«KI kann helfen, Daten zu vereinheitlichen, indem sie Ähnlichkeiten und unterschiedliche Schreibweisen erkennt, die denselben Sachverhalt meinen», erklärt Alexander Rieder, Leiter Produktmanagement Kundenbezogene Daten bei Swiss Post Advertising. So wird aus Zuerich, Zürich, zurich und ZH einheitlich Zürich – und aus Telefonnummern wie +41795550033 oder 079 555 00 33 das standardisierte Format +41 79 555 00 33.
4. Muster erkennen
KI-Systeme sind besonders stark darin, Muster und Zusammenhänge in grossen Datenmengen zu erkennen – und das bietet gegenüber regelbasierten Ansätzen grosse Vorteile. «Wenn wir versuchen würden, ausschliesslich mit festen Regeln zu bestimmen, was ein Familienhaushalt und was eine WG ist, würden wir viele Fälle falsch einordnen», erklärt Shkumbin Sadriu. «Ein entsprechendes KI-Modell hingegen analysiert Datensätze in ihrer Gesamtheit, erkennt darin übereinstimmende Muster – etwa Altersstrukturen, Nachnamen oder Konsumverhalten – und kann dadurch unvoreingenommener kategorisieren.»
5. Datenintegration optimieren
Unternehmen erfassen heute eine Vielzahl von Daten aus unterschiedlichen Quellen. KI-Tools sind in der Lage, die Datensätze zusammenzuführen und ihre Struktur zu vereinheitlichen – ein wichtiger Schritt hin zu einer konsolidierten Datenbasis.
6. Anomalien erkennen
Auffälligkeiten in Daten sind oft schwer zu erkennen, gerade in grossen Beständen. KI-Modelle identifizieren unplausible Werte: etwa eine Hausnummer, die es in der Strasse gar nicht gibt, oder eine E-Mail-Adresse mit unbekannter Domain. Auch widersprüchliche Datensätze – derselbe Kunde einmal mit Adresse in Zürich, einmal in Genf – entdeckt sie automatisiert. «Das hilft nicht nur, Fehler schneller zu erkennen und zu korrigieren, sondern entlarvt sogar potenziell betrügerische Angaben», so Alexander Rieder.
Waren gegen Rechnung zu bestellen, entspricht dem Bedürfnis vieler Konsumentinnen und Konsumenten. Für Onlinehändler birgt dies jedoch ein Risiko: Denn unseriöse Besteller können für die Rechnung eine gefälschte Adresse angeben. So entstehen Verluste, die sich kaum kompensieren lassen. In Zukunft wird die Echtzeit-Kontrolle durch KI-Tools solche Missbräuche erschweren.
Allerdings gibt es bereits heute eine verlässliche Lösung der Schweizerischen Post. Die Dienstleistung Adressgüte analysiert zusätzlich zur Gültigkeit und Korrektheit von Adressangaben auch die Briefkastenaktualität. So erhalten Händler Hinweise auf mögliche Adressmanipulationen und erkennen Betrugsversuche schon während der Erfassung einer Adresse. Der Webservice lässt sich einfach in bestehende Systeme einbinden.
Darüber hinaus bietet die Post in Zusammenarbeit mit einem spezialisierten Partner einen Bonitäts- und Fraud-Check an. Dabei erhalten die User einen Bonitäts-Score der abgefragten Person sowie eine Einschätzung potenzieller Betrugsrisiken – differenziert nach Person, Hausbriefkasten oder Gebäude.
Grenzen der Datenpflege mit KI
Das grösste Risiko in der KI-gestützten Datenpflege ist das blinde Vertrauen in die Technologie. «Viele vergessen, dass KI-Modelle nicht deterministisch arbeiten – sie liefern Wahrscheinlichkeiten, keine Gewissheiten», warnt Lisa Nagel. «Wer die Ergebnisse ungeprüft übernimmt, läuft Gefahr, falsche Schlüsse zu ziehen oder fehlerhafte Datensätze zu übernehmen. Dem kann man mit Stichprobenkontrollen in den Fachabteilungen entgegenwirken. Denn diese verfügen über das nötige Wissen, um beurteilen zu können, ob eine Korrektur der KI plausibel ist.»
Zudem gilt: Eine KI kann nur dann zuverlässig arbeiten, wenn sie die unternehmensspezifischen Logiken kennt. Als Beispiel nennt Lisa Nagel ein Schifffahrtsunternehmen, das jedes Containerschiff im CRM-System als eigene Firma erfasst, obwohl alle Schiffe zur gleichen Reederei gehören. «Wenn die KI diese Logik nicht kennt, würde sie die Einträge als Dubletten einstufen und löschen. Man muss sie also instruieren und ihr die betriebliche Logik erklären.»
Auch die Trainingsdaten können zum Problem werden. Shkumbin Sadriu gibt zu bedenken: «KI-Modelle lernen aus den Trainingsdaten, die ihnen zur Verfügung gestellt werden. Unternehmen müssen sich bewusst sein, dass Trainingsdaten Verzerrungen enthalten können. Angenommen, die KI definiert eine Familie aufgrund der Datenbasis als eine Gruppe bestehend aus Mutter, Vater und mindestens einem Kind. Dann würden Alleinerziehende oder gleichgeschlechtliche Paare mit Kindern nicht als Familie erkannt. Hier geht es also schnell auch um Fragen der Datenethik.»
Doch wie lässt sich dieses Problem lösen? «Zum einen durch kritisches Hinterfragen – sowohl der KI-Ergebnisse als auch der eigenen Denkmuster», so Alexander Rieder. «Mitarbeitende müssen für mögliche Verzerrungen sensibilisiert werden. Zum anderen helfen eine sorgfältige Auswahl und eine laufende Überprüfung der Trainingsdaten. Denn ein Bias entsteht oft durch einseitige oder historisch geprägte Datenquellen.»
Adressdaten systematisch pflegen
So leistungsfähig KI-gestützte Tools auch sind: Gerade bei den Adressdaten sollten Sie trotzdem nicht auf die Unterstützung spezialisierter Dienstleister verzichten. Denn KI ersetzt weder den Abgleich mit laufend aktualisierten Referenzdaten noch das Fachwissen, das für eine dauerhaft hohe Datenqualität nötig ist. Adressdienstleister wie die Post sind immer auf dem neusten Stand, was Umzüge, Namensänderungen oder neue Strassennamen betrifft, und beraten Sie rund um die Adresspflege. Sie bieten Ihnen unter anderem die folgenden Dienstleistungen an:
Adressanalyse und -aktualisierung: Wenn Sie regelmässig adressierte Mailings verschicken, ist es unerlässlich, Ihren Adressstamm vor jedem Versand zu aktualisieren. Bei der Adressprüfung durch einen Adressdienstleister wird die Gültigkeit von Personen- oder Firmenadressen überprüft. Enthält Ihre Datenbank veraltete, fehlerhafte oder ungültige Daten, können Sie vom Adressdienstleister die korrigierten Adressen beziehen.
Abgleich mit Sterberegister: Manche Adressdienstleister führen ein Sterberegister, mit dem Sie Ihren Adressstamm abgleichen können. So vermeiden Sie es, dass Hinterbliebene von Ihnen Post für die verstorbene Person erhalten.
Adresspflege durch Experten: Wollen Sie aufgrund Ihrer knappen Ressourcen die gesamte Adresspflege auslagern? Dann können Sie alle Aufgaben den Fachleuten eines Adressdienstleisters überlassen. Sie bereinigen, aktualisieren und verifizieren Ihre Adressen nach Bedarf.
Adressen nachforschen: Haben Sie Adressen wichtiger Kundinnen oder Spender verloren? Oder liegt der letzte Kontakt lange zurück? Dann können Sie auf den Suchservice eines Adressdienstleisters zurückgreifen. Bei dieser Recherche werden Ihre Daten mit internen und externen Quellen aus dem In- und Ausland abgeglichen.
Fehlerhafte Adressdaten bringen gleich mehrere Probleme mit sich:
- Wichtige Sendungen wie Verträge oder Rechnungen kommen nicht an
- Streuverluste und schlechtere Erfolgskennzahlen durch unzustellbare Werbesendungen
- Unnötige Kosten für doppelte Sendungen
- Hoher Aufwand für das Verarbeiten von Retouren
- Reputationsschaden: Fehlerhafte Adressen werden als mangelnde Wertschätzung empfunden