Alle 14 Tage aktuelle News aus der IT-Szene   >   
Zscaler warnt vor Malware-Kampagnen nach Leak von Claude Code 09. 04. 2026
Nach der versehentlichen Veröffentlichung des Quellcodes von Claude Code analysiert Zscaler zunehmende Bedrohungsaktivitäten. Cyberkriminelle nutzen das öffentliche Interesse gezielt zur Verbreitung von Schadsoftware.
NetApp und Nutanix kooperieren bei Cloud-Plattform 08. 04. 2026
NetApp und Nutanix haben eine strategische Allianz angekündigt, die auf die Integration von Dateninfrastruktur und Hybrid-Multicloud-Plattform abzielt. Die Zusammenarbeit soll Unternehmen neue Optionen für die Modernisierung virtualisierter Umgebungen bieten und den Betrieb über verschiedene IT-Umgebungen hinweg vereinfachen.
Weniger Papier, mehr Effizienz: Digitale Signaturen zeigen messbare Wirkung 03. 04. 2026
Die aktuelle ÖkoStats-Auswertung von A-Trust zeigt: Die Nutzung qualifizierter elektronischer Signaturen steigt weiter – mit klar messbaren Effekten auf Ressourcenverbrauch und Effizienz.
Axios Supply-Chain-Attacke untergräbt Vertrauen in npm: Weit verbreitete Software im Fadenkreuz von Cyberkriminellen 02. 04. 2026
Die mutmaßliche Kompromittierung des weit verbreiteten HTTP-Clients Axios wirft ein Schlaglicht auf strukturelle Schwächen moderner Software-Lieferketten. Ein Kommentar von Ismael Valenzuela ordnet die Risiken für Unternehmen ein.
Michael Schmitz übernimmt Leitung von SAP Concur in der MEE-Region 01. 04. 2026
SAP bündelt das Concur-Geschäft in Mittel- und Osteuropa neu. Michael Schmitz verantwortet ab sofort die Region und soll die Vertriebsstruktur weiterentwickeln.
Michael Weinzierl übernimmt Geschäftsführung von Arrow ECS Österreich 01. 04. 2026
Der Technologieanbieter Arrow ordnet seine Führungsstruktur in der DACH-Region neu. Mit Michael Weinzierl übernimmt ein langjähriger Manager die Geschäftsleitung in Österreich, während die regionale Verantwortung gebündelt wird.
Cyberangriff auf EU-Kommission rückt Hackergruppe ShinyHunters in den Fokus 31. 03. 2026
Nach dem Angriff auf die Cloud-Infrastruktur der EU-Kommission analysiert ESET die mutmaßlichen Täter. Im Mittelpunkt steht die Gruppe ShinyHunters, deren Vorgehensweise auf bekannte Muster bei groß angelegten Datenlecks hinweist.
Adastra baut Wien-Standort aus und holt Go-to-Market-Lead 31. 03. 2026
Das kanadisch-tschechische IT-Beratungsunternehmen Adastra stärkt seine Präsenz in Wien und treibt die Expansion in Richtung Westeuropa voran. Mit Mario Klima übernimmt ein erfahrener Branchenkenner die Rolle des Go-to-Market-Lead für Österreich.
Insight ernennt Jack Azagury zum CEO 30. 03. 2026
Insight Enterprises bestellt mit Jack Azagury einen neuen President und CEO. Der frühere Accenture-Manager soll die Transformation des Unternehmens hin zu einem „AI-first“-Lösungsintegrator vorantreiben.
Check Point stellt Referenzarchitektur für KI-Rechenzentren vor 30. 03. 2026
Check Point hat mit dem „AI Factory Security Blueprint“ eine Referenzarchitektur zur Absicherung von KI-Infrastrukturen veröffentlicht. Der Ansatz deckt alle Ebenen von Hardware bis Anwendung ab und adressiert spezifische Bedrohungen moderner KI-Umgebungen.
Arctic Wolf und Wiz integrieren Cloud Detection und Response 27. 03. 2026
Arctic Wolf und Wiz (nun Teil von Google Cloud) haben eine Partnerschaft zur Integration ihrer Plattformen angekündigt. Ziel ist es, Cloud-Bedrohungen schneller zu erkennen und darauf zu reagieren. Die Lösung kombiniert Cloud-Transparenz und Risikobewertung mit Security Operations und ist ab sofort verfügbar.
NetApp und Commvault bündeln Technologien für integrierte Cyber-Resilienz 27. 03. 2026
NetApp und Commvault haben eine strategische Partnerschaft angekündigt. Ziel ist eine gemeinsame Plattform für Datenschutz, Cyber-Resilienz und schnelle Wiederherstellung über hybride Infrastrukturen hinweg.
MariaDB integriert GridGain und positioniert sich für agentische KI-Systeme 26. 03. 2026
Mit der Übernahme von GridGain Systems erweitert MariaDB seine Datenplattform um In-Memory-Technologie und reagiert damit auf steigende Anforderungen durch autonome KI-Agenten. Ziel ist eine einheitliche Architektur für Transaktionen, Analytik und KI-Workloads.
Vertiv übernimmt ThermoKey und stärkt Kühltechnologien für KI-Rechenzentren 26. 03. 2026
Vertiv plant die Übernahme des italienischen Wärmetechnik-Spezialisten ThermoKey. Ziel ist der Ausbau des Portfolios für thermisches Management in Rechenzentren und KI-Infrastrukturen.
Ungenutzte Software-Lizenzen: Millionenpotenzial in Österreichs Serverräumen 26. 03. 2026
In österreichischen Unternehmen sind laut Schätzungen Millionenbeträge in ungenutzten Software-Lizenzen gebunden. Besonders durch den Umstieg auf Cloud-Modelle entsteht ein wachsender finanzieller Spielraum.
Arrive ernennt Chief AI Officer und richtet Strategie auf „AI first“ aus 24. 03. 2026
Die Mobilitätsplattform Arrive setzt künftig verstärkt auf Künstliche Intelligenz. Mit der Ernennung eines Chief AI Officers und Investitionen in die Weiterbildung der Mitarbeitenden soll KI zentraler Bestandteil der Unternehmensstrategie werden.
Accenture Österreich: Christian Winkelhofer übernimmt Leitung von Michael Zettel 24. 03. 2026
Führungswechsel bei Accenture Österreich: Nach zehn Jahren als Country Managing Director übergibt Michael Zettel seine Funktion an Christian Winkelhofer. Zettel wechselt in das Management der Region EMEA.
ESET PROTECT: Mehr Sicherheit für Cloud, virtuelle Maschinen und KI-gestützte Analyse 23. 03. 2026
ESET baut seine Sicherheitsplattform ESET PROTECT gezielt für Cloud-Umgebungen aus. Neue Funktionen für Microsoft 365, Google Workspace und virtuelle Maschinen sowie erweiterte Analyse- und KI-Tools sollen Unternehmen mehr Transparenz und Schutz vor aktuellen Bedrohungen bieten.
weiter
Gastbeitrg von Sebastian Scheele, CEO und Co-Gründer von Kubermatic

Hardwareausfälle werden zur Herausforderung im KI-Betrieb

GPU-Ausfälle werden zum Problem. Bei 25.000 GPUs fällt die Hardware durchschnittlich alle 2,5 Stunden aus. Bei 100.000 GPUs entspricht dies mehrere Ausfälle pro Stunde, nicht gelegentlich, sondern ständig – und das ist keine Hypothese.

Foto: Kubermatic Sebastian Scheele, CEO und Co-Gründer von Kubermatic: OpenAI hat GPT-4 auf 25.000 A100s trainiert, die von Kubernetes verwaltet werden. xAI betreibt 100.000 H100s. Die Flotte von Meta ist sogar noch größer. Bei dieser Größenordnung ist die Lösung nicht einfach bessere Hardware. Erforderlich sind maßgeschneiderte Operatoren, die jede GPU als individuell verfolgtes Asset behandeln, mit automatisierter Quarantäne. Bei einem Ausfall wird ein 100-Terabyte-Trainingsstatus als Checkpoint gespeichert und innerhalb von Minuten auf fehlerfreien Knoten fortgesetzt. Auf diese Weise gelingt es, eine Auslastung von 97 Prozent aufrechtzuerhalten, wenn die Infrastruktur ständig ausfällt.

Meta hat etwas Schlimmeres als Abstürze entdeckt: stille Datenverfälschung. Eine GPU berechnet die falsche Antwort, und die Überwachung erkennt dies nicht. Bei einer Flotte in dieser Größenordnung ist also davon auszugehen, dass irgendwo im Cluster immer etwas falsch berechnet wird. Meta hat einen speziellen Reliability-Stack entwickelt, um dies zu erkennen, einschließlich einer Plattform zur Ursachenanalyse, die täglich Zehntausende von Diagnosen durchführt.

Im KI-Maßstab sind Ausfälle der Normalzustand

Die Kluft zwischen „Wir betreiben Kubernetes” und „Wir betreiben KI auf Kubernetes” ist nicht inkrementell, sie ist architektonisch. Die meisten Teams behandeln GPU-Ausfälle als Ausnahmefälle. Im KI-Maßstab sind Ausfälle jedoch der Normalzustand. Ein Cluster benötigt benutzerdefinierte Health-Operatoren, nicht nur eine automatische Reparatur der Knoten. Erforderlich ist eine Neuverteilung des Workloads, die innerhalb von Sekunden erfolgt, nicht über Tickets.

Ein einzelner Kubernetes-Cluster degradiert etwa 5.000 Knoten. KI-Training übertrifft dies bei weitem. Unternehmen benötigen eine Cluster-Föderation oder eine Managementebene, die ihre Flotte als ein einziges System behandelt. Teams, die ernsthafte KI-Infrastrukturen auf Kubernetes aufbauen, führen nicht einfach kubectl aus und hoffen auf das Beste, sondern sie bauen darauf zuverlässige Engineering-Stacks auf. Kubernetes ist zum KI-Betriebssystem avanciert, aber das Betriebssystem kann nur der Ausgangspunkt sein.

 

it&t business medien eU
Tel.: +43/1/369 80 67-0
office@ittbusiness.at