Geheimnis enthüllt: Scheitert die NSA an mangelnder Datenqualität?

Der Abhörskandal um den US-Geheimdienst NSA zieht immer größere Kreise. Laut einem Bericht der “Washington Post” spähen die Agenten jedes Jahr Kontaktdaten von mehreren hundert Millionen Internetnutzern in aller Welt aus. Die Informationen werden dabei aus persönlichen E-Mail-Adressbüchern, Freundeslisten und von Twitter abgeschöpft.

Geheimnis enthüllt: Scheitert die NSA an mangelnder Datenqualität?

Human Inference: Datenqualität

Der Abhörskandal um den US-Geheimdienst NSA zieht immer größere Kreise. Laut einem Bericht der “Washington Post” spähen die Agenten jedes Jahr Kontaktdaten von mehreren hundert Millionen Internetnutzern in aller Welt aus. Die Informationen werden dabei aus persönlichen E-Mail-Adressbüchern, Freundeslisten und von Twitter abgeschöpft. Online gespeicherte Kontaktlisten – so zitiert der Bericht Geheimdienstexperten – seien ergiebigere Datenquellen als das Abhören von Mobiltelefonen. Denn die Adressbücher enthielten nicht nur Namen und E-Mail-Adressen, sondern häufig auch Telefonnummern, Anschriften und Informationen über Familien und Geschäfte.

An einem einzigen Tag des vergangenen Jahres sollen die Schnüffler 444.743 E-Mail-Adressbücher von Yahoo, 105.068 von Hotmail, 82.857 von Facebook und 33.697 von Googlemail für ihre Zwecke gesammelt haben. Weitere 22.881 Datensätze stammten aus nicht näher aufgeschlüsselten Quellen, wie die Zeitung aus einer internen Powerpoint-Präsentation der NSA erfahren hat. Sind das z.B. Kundendatensätze aus cloudbasierten Systemen für das Customer Relationship Management (CRM)?

Doch ob sich für den US-Geheimdienst dieser illegale Sammeleifer tatsächlich lohnt, scheint mehr als fraglich. Denn viele Adressverzeichnisse sind unvollständig, inkonsistent, veraltet oder enthalten Dubletten. Dies ist auch nicht weiter verwunderlich, denn alleine in Deutschland gibt es im Jahr ca. 4 Millionen Umzüge und etwa 30.000 Änderungen bei Straßen, Postleitzahlen und Orten. Dazu kommen mehrfach angelegte Datensätze, Falscherfassungen und typische Buchstabendreher bei der telefonischen Aufnahme der Adressen oder falsch ausgefüllte Online-Formulare. Solche Fehler verursachen für die Unternehmen hohe Kosten – beispielsweise in Form von verpufften Marketingaktionen, unzustellbaren Rechnungen oder geschäftlichen Fehlentscheidungen aufgrund unzutreffender Analysen.

Im Whitepaper “Power of Knowledge” beschreiben die Datenqualitätsexperten von Human Inference, wie man aus diesem Dillema herauskommt und gehen auf die Geheimnisse der Adressdaten ein. Unter anderem wird erklärt, warum traditionelle Methoden wie das Matching in der Regel nicht zum gewünschten Ergebnis führen. Und es werden automatisierte Lösungen für die Datenbereinigung vorgestellt, die mathematische Verfahren mit der Verarbeitung natürlicher Sprache kombinieren. Denn es gilt, die Wissenslücke zwischen mathematischen und statistischen Techniken auf der einen und der Verwendung einer intelligenten Interpretationsmaschine und großer Wissenssammlungen auf der anderen Seite zu überbrücken. Nur dann kommen am Ende brauchbare Ergebnisse heraus und unvollständige oder fehlerhafte Adressdatenbanken können automatisch bereinigt und angereichert werden.

Im Gegensatz zur NSA betreibt Human Inference jedoch keine Geheimniskrämerei, sondern stellt seine Erkenntnisse allen Interessierten kostenfrei zur Verfügung.

Weitere Informationen finden Sie im Whitepaper: “Power of Knowledge”

Über Human Inference
Human Inference ist ein führender Anbieter von Lösungen für das Management von Kundendaten. Die Lösungen ermöglichen es, die Interaktion zwischen Unternehmen und ihren Kunden zu optimieren. Die Anwendung von Techniken der natürlichen Sprachverarbeitung auf Basis umfangreicher Wissenskorpora garantiert erstklassige Resultate. Human Inference besteht seit 1986 und genießt großes Ansehen auf dem Gebiet der Datenqualität und der Datenintegration. Neben dem Firmensitz in Arnheim (NL) verfügt Human Inference über eine Niederlassung in Deutschland. Seit Dezember 2012 gehört Human Inference zu Neopost, dem in Europa führenden und weltweit zweitgrößten Anbieter für Postbearbeitungs- und Logistiklösungen. Die börsennotierte Neopost-Gruppe mit Hauptsitz in Frankreich sowie 29 Niederlassungen weltweit, bietet Produkte und Dienstleistungen in 90 Ländern an und beschäftigt rund 5.900 Mitarbeiter. Zudem verfügt sie über 1.300 Vertriebsbeauftragte und 450 Entwicklungsingenieure. Seinen mehr als 250 Kunden, darunter Allianz, Center Parcs, DHL, E.ON, Hülsta, NordLB und Schufa, verhilft Human Inference zu mehr Kundennähe, optimierten betrieblichen Prozessen (“Operational Excellence”) und erfolgreicher regelkonformer Datensicherung (“Regulatory Compliance”). Mehr unter www.humaninference.de und http://datacleaner.eobjects.org.

Kontakt
Human Inference GmbH
Holger Wandt
Fritz-Vomfelde-Strasse 34-38
40547 Düsseldorf
02115228150
info@humaninference.de
http://www.humaninference.de

Pressekontakt:
Conosco – Agentur für PR und Kommunikation
Bernhard Müller
Klosterstrasse 62
40211 Düsseldorf
0211160250
bm@conosco.de
http://www.conosco.de

(159815 Posts)

Leave a Reply

Your email address will not be published. Required fields are marked *

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.