Alle 14 Tage aktuelle News aus der IT-Szene   >   
Kyocera feiert 10 Jahre Print Green 07. 12. 2021
Das Klimaschutzprogramm hat bisher rund 500.000 Tonnen CO2 kompensiert.
Drei lanciert 3G-Zutrittssystem 06. 12. 2021
Zutritts-Check vereinfacht Kontrolle des 3G-Status durch Arbeitgeber.
Florierender Markt für Access-as-a-Service-Cyberkriminalität 03. 12. 2021
Studie von Trend Micro: Der Cybercrime-Markt professionalisiert sich zusehends.
Positive Perspektiven 02. 12. 2021
Die rund 120 Teilnehmer zeigten sich auf dem Partnerevent 2021 von Cloud-ERP-Pionier myfactory guter Dinge.
Magenta kürte die innovativsten IoT-Lösungen 01. 12. 2021
Magenta IoT-Challenge honoriert nützliche und technisch reife Lösungen mit Markt- und Entwicklungspotential.
Veränderte Prioritäten in Zeiten einer Pandemie 30. 11. 2021
BARC veröffentlicht zweite Covid-Studie über die Auswirkungen der Krise auf Data & Analytics in Unternehmen.
"KI wird alternativlos werden" 29. 11. 2021
In der KI-gestützten Arbeitswelt der Zukunft steht der Mensch im Zentrum, prognostiziert die Kundenkonferenz.
UNO-148 Industrie PC für DIN-Rail Montage 24. 11. 2021
Robuster und leistungsstarker Industrie-PC (IPC) Automation Computer mit Intel Core i-Prozessor der 11. Generation.
Crate.io kündigt CrateOM an 23. 11. 2021
Die intelligente Lösung digitalisiert und optimiert Betriebsprozesse.
Arctic Wolf eröffnet Security Operations Center in Frankfurt 18. 11. 2021
Das IT-Security-Unternehmen baut seine Aktivitäten in der DACH-Region aus.
Neue Datacenter-Regionen 16. 11. 2021
hosttech erweitert sein virtual Datacenter mit neuen Serverstandorten in Wien und Appenzell.
SAP vergibt Quality Awards 2021 15. 11. 2021
Die Wiener Prinzhorn Holding, die Grazer Neuroth AG und Saatbau Linz wurden prämiert.
MP2 IT-Solutions baut IT-Kompetenz für den Gesundheitsbereich aus 12. 11. 2021
Der IT-Experte gründete kürzlich das Competence Center Digital Healthcare.
3G am Arbeitsplatz digital kontrollieren. 11. 11. 2021
Konica Minolta unterstützt Arbeitgeber mit „3G App“.
Nachhaltigkeit im Fokus 10. 11. 2021
SAP „Responsible Design and Production“ erleichtert den Umstieg auf Kreislaufwirtschaft.
Omega stellt sich neu auf 09. 11. 2021
Neuaufstellung der Vertriebskanäle bringt Änderungen im Top-Management.
Drei und SPL Tele bauen österreichweites LoRaWAN-Netz 08. 11. 2021
Die IoT-Technologie sorgt für die autonome Übertragung geringster Datenmengen, geringe Kosten und hohe Reichweiten.
LowPower-Sensorüberwachung mit großen Reichweiten 05. 11. 2021
BellEquip nimmt die innovativen Sensortechnologien von nke WATTECO ins Programm.
weiter
The unbelievable Machine Company

Mit Data Science auf Gaunerjagd

Big Data-Experte ortet enormes Potenzial in der Auswertung der Panama Papers.

Foto: um Christian Nietner, Data Scientist bei *um: „Die Vorgehensweise mit herkömmlichen Datentools ist nicht schnell und letztlich nicht wirksam genug“ Die „Panama Papers“ sind das größte Datenleak der Mediengeschichte. Ihre Veröffentlichung bringt eine unglaubliche Zahl von Korruptions-, Steuer- und anderen Delikten bis zum Bruch von UN-Sanktionen zutage. Die Arbeit des Recherchenetzwerks wird deshalb zu Recht als Glanzleistung des Enthüllungsjournalismus gefeiert. Doch wurden möglicherweise noch nicht alle Möglichkeiten genutzt, um in kurzer Zeit noch mehr verborgene Zusammenhänge zu finden. „Die Sternstunde von Datenjournalismus und Data Science steht noch aus“, meint Christian Nietner vom Big-Data-Spezialisten The unbelievable Machine Company (*um). Er erläutert, wie effektiver recherchiert und analysiert werden könnte, um neue Erkenntnisse aus den Daten zu gewinnen.

Optimierungspotential.

Bei den Panama Papers hat die Süddeutsche Zeitung gemeinsam mit einem Netzwerk von 400 Journalisten aus über 100 Medienorganisationen und 80 verschiedenen Nationen mehr als ein Jahr recherchiert sowie die Daten analysiert und ausgewertet – teils mit technischer Unterstützung, aber auch manuell. Aus Data-Science-Sicht besteht hier ein hohes Optimierungspotenzial bei der Automatisierung und Qualität der Auswertung. „Die Vorgehensweise mit herkömmlichen Datentools ist nicht schnell und letztlich nicht wirksam genug. Sie verschenkt viele Möglichkeiten“, so Nietner. „Die Aufdeckung der Panama Papers ist beispiellos und könnte ein exzellentes Beispiel für wirksam angewandte Data Science sein, die auch die Zusammenführung und Verarbeitung unstrukturierter Daten, wie Emails, PDFs und Grafiken ermöglicht und damit zu wesentlich besseren Endergebnisse führen könnte“.

Beschleunigte Recherche.

Der Big-Data-Spezialist hat die Berichterstattung zu den Panama Papers aus Data-Science-Perspektive betrachtet und sich selbst die Frage gestellt, was mithilfe der aktuell verfügbaren Datentechnologien bei der Analyse und Auswertung dieser riesigen Datenmenge schneller und effektiver gemacht werden könnte. Anstatt jeden Ordner einzeln zu durchsuchen, empfiehlt sich beispielsweise der Einsatz einer hochgradig skalierbaren und konfigurierbaren Volltextsuchmaschine, die sowohl strukturierte als auch unstrukturierte Textdaten in einem gemeinsamen Datenpool konsolidieren kann. „Die automatisierte Auswertung von Bilddaten kann mittels tiefer neuronaler Netze erfolgen, wahlweise in Kombination mit Machine-Learning-Algorithmen für die Verarbeitung natürlicher Sprache. Die so gewonnenen Daten können anschließend dem Datenpool hinzugefügt werden. Statt vieler einzelner Dokumente, die über hunderte Ordner verteilt sind, erhält man auf diese Weise einen einzigen, effizient durchsuchbaren Datenpool aller Dokumente“, erklärt Nietner.

Zusammenhänge und Muster erkennen.

Ein wesentlicher Teil der Auswertung besteht nicht alleine in der Konsolidierung der Daten, sondern im Aufdecken und Validieren von unbekannten und nicht offensichtlichen Mustern und Zusammenhängen in den Informationen. Gerade hier leistet die Data Science einen enormen Mehrwert. „Ganz konkret könnten etwa Algorithmen zur Named Entity Recognition (NER) verwendet werden, die drauf trainiert sind, einen Fließtext automatisiert auf Eigennamen von Personen, Orten, Organisationen oder auch Zeitangaben zu durchsuchen“, so Nietner.
it&t business medien OG
Tel.: +43/1/369 80 67-0
office@ittbusiness.at
Wir verwenden Cookies, um Ihnen den bestmöglichen Service anbieten zu können. Wenn Sie auf der Seite weitersurfen, stimmen Sie der Cookie-Nutzung zu.
OK