Alle 14 Tage aktuelle News aus der IT-Szene >
Gastbeitrag: In modernen Organisationen werden in vielen Geschäftsprozessen wertvolle Unternehmensdaten generiert. Durch nahezu endlose Skalierungsmöglichkeiten moderner Cloud-Technologien liegen die Herausforderungen in der Entwicklung datengetriebener Geschäftsanwendungen weniger in der Verfügbarkeit von Recheninfrastruktur als viel mehr im Vorhandensein geeigneter Prozesse, Frameworks und Software-Systeme für ein unternehmensweites Daten-Management. Von Ahmed Sayed, Abdulrahman Kaitoua, Tayfun Wiechert und Johann Füchsl.
Foto: Collage, AWS
Die Autoren (von links oben im Uhrzeigersinn): Ahmed Sayed, Abdulrahman Kaitoua, Tayfun Wiechert und Johann Füchsl
Unternehmensübergreifend hören wir folgende Fragestellungen: Wie stelle ich meine Datenprodukte anderen Abteilungen zur Verfügung? Welche Mittel besitze ich, um relevante Daten zu finden? Wie stelle ich sicher, dass nur berechtige Personen Zugriff auf bestimmte Daten haben?
Eine häufige Antwort darauf bestand im Aufbau unternehmensweiter Data Lakes, welche durch eines oder mehrere zentrale Teams entwickelt und betrieben werden. Daten aus verschiedenen Geschäftsbereichen werden aus den Quellsystemen extrahiert und zentral auf einem hochverfügbaren und skalierbaren Datenspeicher – dem Data Lake – in ihrem Rohformat repliziert. Das Wertversprechen: Durch die zentrale und einheitliche Verfügbarkeit einer Vielzahl von Unternehmensdaten wird die Entwicklung datengetriebener Anwendungen beschleunigt und Geschäftsbereich-übergreifende Analysen ad-hoc ermöglicht. Ein Beispiel dafür ist die Beantwortung der Fragestellung, ob Produktionsparameter in einem bestimmten Zeitraum Einfluss auf Kundenbewertungen hatten.
Data Engineers werden durch diesen zentralisierten Zugang zunehmend zum Flaschenhals innerhalb der Organisation, da sie einerseits Integrationen zu Quellsystemen entwickeln, damit Daten verfügbar werden, diese dann analysieren und modellieren. um Geschäftswerte aus den Daten zu generieren und zusätzlich auch noch über Zugriffsberechtigungen entscheiden müssen. Das kann dazu führen, dass technisch versierte Teams eigene Silo-artige Lösungen entwickeln, welche abgeschirmt vom Rest der Organisation agieren. Die Zusammenarbeit und das Austauschen von Daten werden so behindert, was die Transformation zu einer datengetriebenen Organisation verlangsamt.
Eine Lösung zur Verwaltung verteilter Datenprodukte kann bei diesen Herausforderungen helfen, wenn sie entsprechende Funktionalität bereitstellt: Sie muss es Teams erlauben, ihre Datenprodukte selbst zu entwickeln und dann innerhalb einer zentralen Plattform zu registrieren. Interessierte finden relevante Datenprodukte auf der Plattform und beantragen Zugang, worauf das System sicherstellt, dass die Anfrage bei der Personengruppe landet, welche die fachliche Entscheidungskompetenz besitzt.
Data.all, eine Open Source Lösung von Amazon Web Services (AWS) Professional Services, ermöglicht die Verwaltung von verteilten Datenprodukten und bietet eine zentrale Schnittstelle für den sicheren Zugriff auf Daten innerhalb einer Organisation. Der Betriebs- und Koordinationsaufwand der zentralen Data Engineer Rolle schwindet somit, sodass sich diese vermehrt auf Kern- und Innovationsthemen, wie zum Beispiel Kosteneffizienz der Dateninfrastruktur, Modernisierung von Datawarehouses, Konsolidierung von Legacy Datenbanken und Echtzeitdatenverarbeitung konzentrieren können.
Dieser Beitrag ist der neunte Teil unserer AWS-Serie zum Thema Digitalisierung. Die vorigen Beiträge lesen Sie hier: