Dubletten zwischen zwei Tabellen suchen in Excel

Sperrlisten sind ein wichtiger Bestandteil des Marketings. Diese zu pflegen ist nicht weiter schwer. Und mit Hilfe des DedupeWizard können Sperrlisten auch ohne Probleme verarbeitet werden.

Sperrlisten sind ein gutes Hilfsmittel um dem Wunsch einzelner Adressaten keine Werbung zu erhalten nachzukommen und dabei sogar noch Geld zu sparen. Darüber hinaus können mit eigenen Sperrlisten aber auch Konkurrenten, die eigenen Mitarbeiter oder bei Neukundenwerbung die eigenen Kunden als Empfänger von bestimmten Marketing-Kampagnen ausgeschlossen werden.

Um Sperrlisten verarbeiten zu können benötigt man ein Programm das in der Lage ist eine unscharfe Suche nach Dubletten zwischen zwei Tabellen durchzuführen, wie zum Beispiel dem DedupeWizard. Mit Hilfe der Suche nach Dubletten zwischen zwei Tabellen können darüber hinaus auch Adresslisten synchronisiert werden, beispielsweise um Adressen die bereits mit einer früheren Marketing-Kampagne beworben worden sind nicht noch einmal zu bewerben oder um Informationen, wie beispielsweise die Telefon- oder Kundennummer, anhand des Abgleichsergebnisses aus der einen Adressliste in eine andere zu übertragen. Die Einsatzmöglichkeiten der Suche nach Dubletten zwischen zwei Tabellen sind vielfältig. Und mit dem DedupeWizard ist die Suche nach Dubletten zwischen zwei Tabellen auch schnell erledigt.

Gehen Sie dazu folgendermaßen vor:

  1. Wenn Sie das nicht schon getan haben, dann laden Sie sich den DedupeWizard hier lostenlos herunter. Installieren Sie das Programm und fordern Sie eine Testfreischaltung an. Damit können Sie dann eine Woche lang ohne jede Einschränkung mit dem Programm arbeiten.
  2. Die Funktion die wir benötigen ist die 'Dublettensuche zwischen zwei Dateien'.

    Dublettensuche zwischen zwei Dateien

  3. Nach dem Aufruf dieser Funktion ist zunächst das Abgleichskriterium zu wählen. Die Suche nach Dubletten kann auf Basis der postalischen Adresse, der Telefonnummer oder der Emailadresse durchgeführt werden. Wählen wir die postalische Adresse.

    Abgleichskriterium

  4. Nach einem Klick auf die Schaltfläche 'Weiter' sind als nächstes die beiden zu bearbeitenden Excel-Dateien zu öffnen.

    Datei öffnen

    Wenn ein anderes als das erste Arbeitsblatt aus der betreffenden Excel-Datei verwendet werden soll, dann kann dieses später noch, in dem Dialog auf der auch die Feldzuordnung vorgenommen wird, ausgewählt werden.
  5. Das Programm leitet uns nach dem Öffnen der Excel-Dateien automatisch zum nächsten Schritt, der Feldzuordnung weiter. Dabei ist dem Programm anzugeben in welcher Spalte der Tabelle es welche Information findet, also beispielsweise in welcher Spalte die Straße steht oder der Name des Orts. Dazu ist aus den Auswahllisten mit den Spaltennamen aus der Tabelle jeweils dasjenige Datenfeld auszuwählen das am besten zu der Bezeichnung links daneben passt.

    Feldzuordnung
    Eine Vorbelegung dieser Feldzuordnung führt das Programm anhand der Spaltennamen automatisch durch. Nachdem wir über die postalische Adresse nach Dubletten suchen wollen müssen auch für alle Bestandteile der postalischen Adresse diejenigen Spalten aus der zu verarbeitenden Tabelle angegeben werden in denen diese Information gespeichert ist. Das Ergebnis der Feldzuordnung kann mit Hilfe der 'Kontrolle der Feldzuordnung', die sich auf der rechten Hälfte des Bildschirms befindet, kontrolliert werden.
  6. Um die Feldzuordnung der zweiten Tabellen angeben zu können klicken Sie auf die Schaltfläche 'Weiter'. Der Dialog zu dem wir gelangen sieht genauso aus wie der vorherige Dialog und ist auch genauso zu bedienen. Nehmen Sie die Feldzuordnung ganz analog zu der ersten Tabelle vor.
  7. Mit der Schaltfläche 'Weiter' gelangen wir zu dem Dialog in dem die eigentliche Funktion konfiguriert wird. Hier ist allem voran der Schwellwert für die maximal zulässige Abweichung zwischen zwei Adressen anzugeben.

    Übereinstimmungsfaktor Desweiteren können einzelne Bestandteile der postalischen Adresse von dem Abgleich ausgeschlossen werden. Dabei muss natürlich für jeden Bestandteil der postalischen Adresse der mit verglichen werden soll in der im vorherigen Schritt vorgenommenen Feldzuordnung auch eine Spalte aus der zu verarbeitenden Tabelle angegeben werden. Hinweis: Die beiden Tabellen zwischen denen die Suche nach Dubletten durchgeführt werden soll können ganz unterschiedlich aufgebaut sein. Beispielsweise könnte in der einen Tabelle die Hausnummer mit in der gleichen Spalte stehen wie die Straße und in der anderen Tabelle könnte diese Information in zwei getrennten Spalten stehen. Wichtig ist dabei nur, dass in der Feldzuordnung für diese beiden Tabellen auch alle drei Spalten angegeben werden.
  8. Ein Klick auf die Schaltfläche 'Weiter' startet dann die Suche nach Dubletten. Es dauert nicht lange und es wird eine Zusammenfassung des Ergebnisses angezeigt.

    Abgleichsergebnis
    Hat das Programm in der zu verarbeitenden Tabelle Dubletten gefunden, dann führt ein Klick auf die Schaltfläche 'OK' zur manuellen Nachbearbeitung. Ansonsten sollte der Schwellwert für den Übereinstimmungsgrad niedriger gewählt und der Abgleich noch einmal gestartet werden.
  9. Bei der 'manuellen Nachbearbeitung' wird das Ergebnis des Abgleichs in Form einer Tabelle dargestellt. Diejenigen Datensätze die gelöscht werden sollen sind dort mit einem roten Kreuz gekennzeichnet, welches sich bei Bedarf noch löschen oder auf einen anderen Datensatz der Dublettengruppe verschieben lässt.

    Abgleichsergebnis

  10. Nach einem weiteren Klick auf die Schaltfläche 'Weiter' gelangen wir zu dem Dialog mit den Funktionen mit deren Hilfe das Ergebnis weiter verarbeitet werden kann. Beispielsweise könnten wir die zum Löschen markierten Datensätze direkt aus der Ursprungsdatei heraus löschen. Dazu ist lediglich ein Klick auf die Schaltfläche 'in der Ursprungsdatei löschen' nötig.

    in der Ursprungstabelle löschen

Die Suche nach Dubletten zwischen zwei Tabellen kann auch mit den DataQualityTools durchgeführt werden. Diese bieten weit mehr Möglichkeiten als der DedupeWizard, nicht nur bei der Suche nach Dubletten.

Hinweis: Für den DedupeWizard gibt es ein Lehrvideo das am Beispiel der Suche nach Dubletten innerhalb von einer Tabelle in die Bedienung des Programms einführt.

Wie man den DedupeWizard für die Suche nach Dubletten innerhalb von einer Adressliste einsetzt können Sie in dem Artikel 'doppelte Adressen in Excel Löschen' nachlesen.