Matching

Matching bezeichnet den Prozess oder die Aufgabe, Datensätze, die denselben Entitäten entsprechen, aus mehreren Quellsystemen zu identifizieren, abzugleichen und zusammenzuführen. Die betroffenen Entitäten beziehen sich am häufigsten auf Personen, Orte, Veröffentlichungen, Zitate oder Produkte. Matching wird auch als Datensatz- oder Datenverknüpfung, Entitätsauflösung, Objektidentifizierung oder Feldabgleich bezeichnet.

Herausforderungen beim Matching

Das Identifizieren und Abgleichen von Datensätzen über mehrere Datenquellen hinweg ist aus mehreren Gründen eine anspruchsvolle Aufgabe. Eine Hauptherausforderung beim Datenabgleich ist das Fehlen gemeinsamer Entitätsbezeichner in verschiedenen Quellsystemen, die abgeglichen werden müssen. Die Datensätze enthalten in der Regel kein eindeutiges Attribut, das die Identifizierung derjenigen, die auf dieselbe Entität verweisen, erleichtert. Infolgedessen muss der Abgleich mit Attributen durchgeführt werden, die teilweise identifizierende Informationen enthalten, wie Namen, Adressen oder Geburtsdaten. Solche identifizierenden Informationen sind jedoch oft von geringer Qualität und leiden insbesondere unter häufig auftretenden typografischen Variationen und Fehlern.

Ein weiteres Problem besteht darin, dass sich Daten mit der Zeit ändern können. Beim Matching von Personendatenbanken kann ein und dieselbe Person unterschiedliche Wohnsitze angegeben haben oder der Familienname hat sich geändert, da die Person geheiratet hat oder geschieden wurde. Die Informationen können zudem Eingabefehler enthalten oder stehen nur teilweise in den zu vergleichenden Quellen zur Verfügung.

Vorteile des Datenabgleichs

Durch das Auffinden von Verbindungen zwischen Datenelementen wie Name und Adresse können intelligente Matching Tools Duplikate in einer Datenbank finden. Die Tools sind in der Lage, verknüpfte oder ähnliche Datensätze zu identifizieren, wobei Probleme wie Eingabefehler, fehlende Wörter oder Buchstaben, zusätzliche Wörter oder Buchstaben, Kurznamen und Variationen multikultureller Namen berücksichtigt werden. Mittels Matching können Kundendatensätze konsolidiert werden, um ein hohes Maß an Business Intelligence und eine verbesserte Datenbankintegrität zu gewährleisten.

Ohne Datenharmonisierung verteilen sich die Kundendaten gegebenenfalls auf mehrere Datensätze und es ist schwierig bis unmöglich, die Informationen zu nutzen, um nachhaltige Verbindungen mit Verbrauchern über alle Kanäle hinweg herzustellen. Matching ist die Voraussetzung für die Erstellung eines Single Customer View (SCV) und einer detaillierten Kenntnis des Kundenverhaltens.

DataAnalyst.eu

Das Angebot von DataAnalyst.eu richtet sich an Jobsuchende im Bereich Data Science und Unternehmen, die auf der Suche nach Data-Analysten sind.

In unserem Lexikon und Data-Science-Blog bündeln wir für Sie außerdem Informationen rund um Begrifflichkeiten, Berufsfeld, Karriere und Trends.
DataAnalyst.eu
« Back to Glossary Index