SAP will Dremio übernehmen und damit seine Datenbasis für KI-Anwendungen erweitern. Ziel ist die Integration von SAP- und Nicht-SAP-Daten auf einer einheitlichen Plattform.
Foto: Timon - stock.adobe.com
Die Leistungsfähigkeit von KI-Anwendungen hängt in vielen Unternehmen weniger von den Modellen als von der Qualität und Verfügbarkeit der zugrunde liegenden Daten ab. Vor diesem Hintergrund plant SAP die Übernahme von Dremio. Die Transaktion soll die bestehende Datenarchitektur erweitern und eine konsistente Grundlage für analytische und KI-Workloads schaffen. Finanzielle Details wurden nicht veröffentlicht, der Abschluss wird für das dritte Quartal 2026 erwartet und steht unter Vorbehalt behördlicher Genehmigungen.
Ein zentrales Problem vieler KI-Initiativen liegt laut Pressemeldung in fragmentierten Datenbeständen, proprietären Formaten und fehlendem geschäftlichem Kontext. Diese Faktoren erschweren die Skalierung von Projekten, verzögern die Integration neuer Datenquellen und erhöhen den technischen Aufwand.
Die Plattform von Dremio adressiert diese Herausforderungen, indem sie Daten aus unterschiedlichen Quellen zusammenführt und Integrationshürden reduziert. Durch die geplante Übernahme soll diese Funktionalität in die SAP Business Data Cloud und SAP HANA Cloud integriert werden. Ziel ist eine durchgängige Nutzung von Daten für Analysen und KI-Anwendungen über Systemgrenzen hinweg.
Mit Dremio will SAP seine Business Data Cloud zu einem Apache-Iceberg-nativen Enterprise-Lakehouse weiterentwickeln. Damit sollen SAP- und Nicht-SAP-Daten auf einer gemeinsamen offenen Architektur zusammengeführt werden. Apache Iceberg wird dabei als offenes Tabellenformat nativ unterstützt.
Für Unternehmen bedeutet dies laut SAP, dass Daten ohne zusätzliche Bewegung oder Konvertierung für Analysen und KI genutzt werden können. Die Kombination mit der In-Memory-Technologie von SAP HANA Cloud ermöglicht sowohl Echtzeitanalysen als auch operative Workloads auf einer konsistenten Datenbasis.
Die Lakehouse-Plattform von Dremio ist serverlos und elastisch aufgebaut. Sie passt ihre Leistung automatisch an die Nachfrage an und kann sowohl bei steigender Last skalieren als auch bei geringerer Nutzung Ressourcen reduzieren. Dadurch entfällt die Notwendigkeit einer festen Kapazitätsplanung.
Zusätzlich ist ein offener Datenkatalog vorgesehen, der auf Apache Polaris und einer offenen REST-API basiert. Dieser soll als zentrale Zugriffs- und Semantikschicht dienen und einen einheitlichen Kontext über verschiedene Datenquellen hinweg bereitstellen. Dazu zählen unter anderem Informationen zu Beziehungen, Zugriffsrechten und Datenherkunft.
Die geplante Integration bildet laut SAP die Grundlage für weiterführende Konzepte wie den SAP Knowledge Graph und soll den Einsatz von agentischer KI im Unternehmenskontext unterstützen.