Doppelte Adressen in Excel löschen (Adress-Dubletten)

Adresslisten werden gerne mit Excel verwaltet. Und Adresslisten wiederum enthalten nicht selten doppelte Adressen:



Um diese doppelten Adressen in Excel komfortabel und ohne großen Aufwand zu löschen gehen Sie am besten folgendermaßen vor:

  1. Starten Sie den DeduplicationWizard und rufen Sie dort die Funktion "Dublettensuche in einer Tabelle" auf:

    Abgleich in einer Tabelle

  2. Wählen Sie als Kriterium für die Suche nach Dubletten die "postalische Adresse" und klicken Sie anschließend auf "Weiter":

    Abgleichskriterium

  3. Im nächsten Schritt wählen Sie die zu verarbeitende Excel-Datei:

    Dateiauswahl

  4. Anschließend werden Sie zu einem Dialog weiter geleitet in dem Sie dem Programm angeben in welcher Spalte der Excel-Tabelle es welche Information findet. Diese Zuordnung hat das Programm für uns bereits so weit als möglich anhand der Spaltenüberschriften vorgenommen. Beispielsweise enthält die Spalte "Street" in unserer Tabelle die Straße:


    Feldzuordnung

  5. Im nächsten Dialog können wir dem Programm noch angeben welche Adressbestandteile mit verglichen werden sollen, normalerweise alle. Und wir können angeben wie groß der errechnete Übereinstimmungsfaktor zwischen zwei Adressen sein muss, damit diese im Ergebnis auftauchen. In unserem Beispiel wird für den Übereinstimmungsfaktor ein Schwellwert von "70%" verwendet:

    Übereinstimmungsfaktor

  6. Nach einem weiteren Klick auf "Weiter" werden dann die Daten verarbeitet. Schon nach kurzer Zeit präsentiert das Programm eine Zusammenfassung des Ergebnisses:

    Abgleichsergebnis

  7. Anschließend werden wir zu einer Ansicht des Abgleichsergebnisses in Form einer Tabelle geleitet. Dort können wir noch Änderungen an dem Ergebnis vornehmen, indem wir in der Spalte "löschen" das rote Kreuz entweder entfernen oder es auf eine andere Adresse in der Gruppe übertragen:

    Löschmarkierung

  8. Sobald wir mit dem Ergebnis zufrieden sind, können wir das Ergebnis im letzten Schritt entsprechend unseren Bedürfnissen ausgeben oder verarbeiten lassen. Neben einem Löschprotokoll, das ausgedruckt werden kann, können die doppelten Adressen direkt in der Ursprungstabelle gelöscht werden oder es werden die bereinigten Daten in eine neue Datei gespeichert:

    Ergebnisdatei

    Mehr Möglichkeiten das Ergebnis weiter zu verarbeiten als der DeduplicationWizard bieten die DataQualityTools. Unter anderem können dort die Treffer markiert werden. Oder es können anhand des Abgleichsergebnisses Daten von dem einen Datensatz aus der Dublettengruppe auf den anderen übertragen werden, um diesen so zu vervollständigen. Eine vollständige Übersicht darüber finden Sie hier.

  9. Wenn Sie das nicht schon getan haben, dann laden Sie sich den DeduplicationWizard hier kostenlos herunter. Installieren Sie das Programm und fordern Sie eine Testfreischaltung an. Damit können Sie dann eine Woche lang ohne jede Einschränkung mit dem Programm arbeiten.