Talend unterstützt das ICIJ beim Entschlüsseln versteckter Informationen in den Paradise Papers
Mit Talend Data Integration deckt eine Gruppe von investigativen Journalisten (ICIJ) die Offshore-Steueroasen von Machthabern und weltweit bekannten Marken auf
REDWOOD CITY, Kalifornien (USA), 31. Januar 2018. Das Internationale Netzwerk investigativer Journalisten (ICIJ) nutzt Talend Data Fabric für seine Auswertung der so genannten Paradise Papers. Diese Lösung stammt von Talend (NASDAQ: TLND), einem weltweit führenden Anbieter von Integrationslösungen für Cloud und Big Data. Bei den Paradise Papers handelt es sich um 13,4 Millionen verschlüsselte Dokumente von zwei Offshore-Dienstleistern und 19 Steueroasen, die sich der geheimen Abwicklung von Finanztransaktionen politischer Größen und Konzerngiganten verschrieben haben.
Das ICIJ nutzte Talend, um mehr als 1,4 Terabyte unstrukturierter Daten in eine Neo4j-Graphdatenbank zu laden. Mit der Software Linkurious, eine Plattform für die Graphvisualisierung, erfolgen der Informationszugriff und die Datenorganisation.
Der Datenbestand umfasst E-Mails, Excel-, CSV- und PDF-Dateien mit Texten und Bildern zu Unternehmen und Personen, die ein zur Steuervermeidung entwickeltes GeheimsyICIJstem nutzten. Das ICIJ setzte zur Unterstützung seines “Knowledge Centers” weitere Open-Source-Tools ein, um die Daten für die Journalisten durchsuchbar zu machen.
“Wenn es um die Bereinigung, Transformation und Integration der erhaltenen Daten geht, ist die Lösung von Talend für uns das Mittel der Wahl. Für den Aufbau einer robusten Datenbank ist die Lösung für uns unentbehrlich”, so Pierre Romera, CTO des ICIJ. “Das Arbeiten mit Open-Source-Tools wie Talend gewährleistet die Sicherheit und Zuverlässigkeit der Daten, denn unser umfangreiches Netzwerk investigativer Journalisten prüft Dateien mit einem Gesamtvolumen von mehreren Terabyte. Dank der Unterstützung einer riesigen Community von Mitwirkenden und des Einsatzes von Open-Source-Lösungen können wir innovative und topaktuelle Methoden für die Verarbeitung, Extraktion und Veranschaulichung der Daten nutzen.”
Auch die Cloud bildet ein zentrales Element für die Verarbeitung der ICIJ-Daten. Die Organisation macht sich die Leistungsfähigkeit von Amazon Web Services (AWS) zunutze, um alle Daten zu verarbeiten und den Zugriff darauf zu erweitern. Für eine parallele Datenextraktion hat das ICIJ temporäre virtuelle Maschinen eingerichtet. Für die optische Zeichenerkennung und die Extraktion von Texten aus den Dateien werden Ubuntu, Tesseract und ein internes Tool namens Extract eingesetzt.
“In Anbetracht unseres Auftrags und der gigantischen Datenmengen, war die Nutzung von Cloud-Technologien naheliegend. Diese bieten uns bei Bedarf das benötigte Maß an Skalierbarkeit. So können wir unsere Leistungsanforderungen stets sehr einfach erfüllen. Aufgrund seiner robusten Verarbeitungsleistung und der hohen Sicherheit war AWS der geeignetste Anbieter für uns”, erläutert Romera.
Die 13,4 Millionen Dokumente wurden der Süddeutschen Zeitung zugespielt. Sie umfassten Daten zweier Offshore-Dienstleister aus Bermuda und Singapur sowie die Unternehmensregister aus 19 Staaten auf der ganzen Welt. Etwa ein Jahr lang arbeiteten hunderte Journalisten und Medienpartner im Auftrag des ICIJ an der Sichtung dieses Bestands. Die Folgen für viele Prominente und Großunternehmen waren beträchtlich.
“Seit das ICIJ 2016 die Panama Papers veröffentlichte und dafür mit dem Pulitzerpreis ausgezeichnet wurde, wissen wir, wie groß der Nutzen von Datenmanagement- und Datenverarbeitungstechnologien für die Gesellschaft ist”, sagt Ciaran Dynes, SVP of Products bei Talend. “Wir unterstützen gerne gründlichen investigativen Journalismus und helfen all jenen, die aussagekräftige Erkenntnisse aus Daten gewinnen wollen.”
Weitere Informationen zu den Daten, denen die Paradise Papers zugrunde liegen, finden Sie in diesem Video. Mehr zu den Möglichkeiten der Integrationslösungen von Talend erfahren Sie auf www.talend.com
Hat Ihnen diese Meldung gefallen? Dann twittern Sie darüber: #OpenSource-Einsatz zum Wohl der Allgemeinheit: @Talend unterstützt @ICIJ beim Enttarnen von Steueroasen in den #ParadisePapers http://bit.ly/2Drjt8K
Über Talend
Talend (NASDAQ: TLND) ist ein führender Software-Anbieter von Next-Generation-Lösungen für Cloud- und Big-Data-Integrationen. Unternehmen werden dabei unterstützt, aus ihren Daten strategische Wirtschaftsgüter zu entwickeln. Diese helfen dabei, unternehmensweit und in Echtzeit detaillierte Informationen zu Kunden, Partnern und Prozessen zu erhalten. Durch die offene, native und einheitliche Integrationsplattform bietet Talend die benötigte Datenagilität, sodass Unternehmen sehr schnell aktuelle Technologie-Innovationen nutzen können, um die sich ständig verändernden Anforderungen moderner Unternehmen zu unterstützen. Mit Talend sind Unternehmen in der Lage, ihre Dateninfrastruktur zu skalieren und innovative Technologien schnell in der Cloud einzusetzen. Die Lösungen von Talend unterstützen mehr als 1.500 globale Unternehmenskunden aus allen Branchen, darunter AstraZeneca, GE, HP Inc. und Lenovo. Talend wurde sowohl von führenden Analystenhäusern als auch von verschiedenen Branchenmedien mehrfach als führender Anbieter positioniert. Weitere Informationen finden Sie unter www.talend.com Folgen Sie uns auch auf Twitter: @TalendDE
Firmenkontakt
Talend Germany GmbH
Carolin Veser
Servatiusstrasse 53
53175 Bonn
+ 49 151 25540216
cveser@talend.com
http://de.talend.com
Pressekontakt
Hill + Knowlton Strategies
Elisabeth Jost
Darmstädter Landstraße 112
60598 Frankfurt
069 97362 44
elisabeth.jost@hkstrategies.com
http://www.hkstrategies.com/germany/de