it&t business - Mit Data Science auf Gaunerjagd

Österreichs Bundesrechenzentrum fördert Nachhaltigkeit durch CO2-freie IT 23. 04. 2024

Das IT Rechenzentrum des Bundes in Wien treibt mit grünem Strom und innovativen Energierückgewinnungssystemen die Nachhaltigkeit in Österreichs IT-Landschaft voran.

Wachsender Bedarf an digitaler Sicherheit durch Post-Quanten-Kryptographie 22. 04. 2024

Die Ergebnisse des PKI & Digital Trust Report 2024 von Keyfactor und Vanson Bourne unterstreichen den dringenden Bedarf an verbesserten Sicherheitsmaßnahmen in Unternehmen im Hinblick auf die bevorstehende Ära der Quantencomputer.

KI sichert Lieferketten 22. 04. 2024

SAP unterstützt mit KI-gestützten Lieferketteninnovationen bei der Umgestaltung der Fertigung.

A1 Österreich übernimmt die NTT Austria vollständig 10. 04. 2024

A1 Österreich kündigt die Übernahme von 100% der Anteile an der NTT Austria an, nachdem sie bereits das Alcatel Lucent Telefoniegeschäft erfolgreich integrierte.

ACP TechRent fusioniert mit McWERK 08. 04. 2024

ACP TechRent erweitert sein Managed-Service-Angebot im Bereich Workplace und Education.

Veeam würdigt herausragende Leistungen seiner Partner in Österreich 03. 04. 2024

Die Veeam Partner Awards gehen heuer an SNS - Saturn Networking Solutions, ANEO Solutions, A1 Telekom Austria, ACP IT Solutions, Bechtle Austria, Cancom Austria und MAIT Austria.

KPMG Österreich tritt SAP-PartnerEdge-Programm bei 27. 03. 2024

Dem Beratungshaus stehen im Rahmen der neuen Kooperation zahlreiche Tools für die digitale Geschäftstransformation zur Verfügung.

SAP und NVIDIA intensivieren Partnerschaft 20. 03. 2024

Die beiden Tech-Player wollen mit ihrer neuen Kooperation den Einsatz generativer KI in Unternehmensanwendungen vorantreiben.

IT Security made in Austria 13. 03. 2024

Medialine partnert mit dem österreichischen Hersteller von „Quantum safe“ Speicherlösungen fragmentiX.

Neue Funktionen für SAP Datasphere 07. 03. 2024

Frische Features für SAP Datasphere und eine neue Unternehmenspartnerschaft helfen Unternehmen beim produktiven und sicheren Umgang mit Geschäftsdaten.

KI-Transformation: Effizienzsteigerung statt Innovation im Mittelpunkt 06. 03. 2024

Laut einer aktuellen Befragung hat die Mehrheit der Unternehmen noch keine KI-Strategie.

Nagarro fördert Digitalisierungsideen 19. 02. 2024

Nagarro sucht erneut innovative Ideen zu digitalen Geschäftsmodellen, Produkten und Services. Als Gewinn winkt ein Realitätscheck durch Expert:innen im Wert von 50.000 Euro.

Einfacher Weg zur Cloud-First-Strategie 12. 02. 2024

SAP präsentiert neue Möglichkeiten für Migration und Modernisierung von Softwaresystemen.

Dätwyler IT Infra übernimmt Seabix 18. 12. 2023

Der IT-Infrastruktur-Anbieter holt sich eine intelligente Kommunikationslösung ins Portfolio.

Bechtle konsolidiert Geschäft in Österreich 18. 12. 2023

Die beiden österreichischen Unternehmen der Bechtle-Gruppe gehen ab 2024 gemeinsame Wege.

hosttech launcht Kl-gestützte Domainsuche 15. 12. 2023

Der Internet Service Provider lanciert mit Domain GPT eine eigens entwickelte Kl-gestützte Domainsuche.

BOLL übernimmt Distribution von WALLIX in Österreich 15. 12. 2023

Der Security-VAD nimmt die Privileged-Access-Management(PAM)-Lösung des französischen Softwareanbieter ins Programm für Österreich.

vshosting expandiert nach DACH 14. 12. 2023

Der europäische Business Cloud Provider bietet seine Dienstleistungen nun auch im deutschsprachigen Raum an.

ENTERPRISE #BIG DATA

The unbelievable Machine Company

Mit Data Science auf Gaunerjagd 13.06.2016

Big Data-Experte ortet enormes Potenzial in der Auswertung der Panama Papers.

Foto: um Christian Nietner, Data Scientist bei *um: „Die Vorgehensweise mit herkömmlichen Datentools ist nicht schnell und letztlich nicht wirksam genug“ Die „Panama Papers“ sind das größte Datenleak der Mediengeschichte. Ihre Veröffentlichung bringt eine unglaubliche Zahl von Korruptions-, Steuer- und anderen Delikten bis zum Bruch von UN-Sanktionen zutage. Die Arbeit des Recherchenetzwerks wird deshalb zu Recht als Glanzleistung des Enthüllungsjournalismus gefeiert. Doch wurden möglicherweise noch nicht alle Möglichkeiten genutzt, um in kurzer Zeit noch mehr verborgene Zusammenhänge zu finden. „Die Sternstunde von Datenjournalismus und Data Science steht noch aus“, meint Christian Nietner vom Big-Data-Spezialisten The unbelievable Machine Company (*um). Er erläutert, wie effektiver recherchiert und analysiert werden könnte, um neue Erkenntnisse aus den Daten zu gewinnen.

Optimierungspotential.

Bei den Panama Papers hat die Süddeutsche Zeitung gemeinsam mit einem Netzwerk von 400 Journalisten aus über 100 Medienorganisationen und 80 verschiedenen Nationen mehr als ein Jahr recherchiert sowie die Daten analysiert und ausgewertet – teils mit technischer Unterstützung, aber auch manuell. Aus Data-Science-Sicht besteht hier ein hohes Optimierungspotenzial bei der Automatisierung und Qualität der Auswertung. „Die Vorgehensweise mit herkömmlichen Datentools ist nicht schnell und letztlich nicht wirksam genug. Sie verschenkt viele Möglichkeiten“, so Nietner. „Die Aufdeckung der Panama Papers ist beispiellos und könnte ein exzellentes Beispiel für wirksam angewandte Data Science sein, die auch die Zusammenführung und Verarbeitung unstrukturierter Daten, wie Emails, PDFs und Grafiken ermöglicht und damit zu wesentlich besseren Endergebnisse führen könnte“.

Beschleunigte Recherche.

Der Big-Data-Spezialist hat die Berichterstattung zu den Panama Papers aus Data-Science-Perspektive betrachtet und sich selbst die Frage gestellt, was mithilfe der aktuell verfügbaren Datentechnologien bei der Analyse und Auswertung dieser riesigen Datenmenge schneller und effektiver gemacht werden könnte. Anstatt jeden Ordner einzeln zu durchsuchen, empfiehlt sich beispielsweise der Einsatz einer hochgradig skalierbaren und konfigurierbaren Volltextsuchmaschine, die sowohl strukturierte als auch unstrukturierte Textdaten in einem gemeinsamen Datenpool konsolidieren kann. „Die automatisierte Auswertung von Bilddaten kann mittels tiefer neuronaler Netze erfolgen, wahlweise in Kombination mit Machine-Learning-Algorithmen für die Verarbeitung natürlicher Sprache. Die so gewonnenen Daten können anschließend dem Datenpool hinzugefügt werden. Statt vieler einzelner Dokumente, die über hunderte Ordner verteilt sind, erhält man auf diese Weise einen einzigen, effizient durchsuchbaren Datenpool aller Dokumente“, erklärt Nietner.

Zusammenhänge und Muster erkennen.

Ein wesentlicher Teil der Auswertung besteht nicht alleine in der Konsolidierung der Daten, sondern im Aufdecken und Validieren von unbekannten und nicht offensichtlichen Mustern und Zusammenhängen in den Informationen. Gerade hier leistet die Data Science einen enormen Mehrwert. „Ganz konkret könnten etwa Algorithmen zur Named Entity Recognition (NER) verwendet werden, die drauf trainiert sind, einen Fließtext automatisiert auf Eigennamen von Personen, Orten, Organisationen oder auch Zeitangaben zu durchsuchen“, so Nietner.

#BIG DATA

it&t business medien eU
Tel.: +43/1/369 80 67-0
office@ittbusiness.at

Impressum

Datenschutz

Website by NIKOLL.AT