Hewlett Packard Enterprise (HPE) errichtet zwei neue Systeme für das Oak Ridge National Laboratory des US-Energieministeriums: den Exascale-Supercomputer „Discovery“ und das KI-Cluster „Lux“. Während Discovery auf die nächste Generation der HPE-Cray-Supercomputing-Architektur setzt, entsteht mit Lux eine mandantenfähige Plattform für Künstliche Intelligenz.
Foto: HPE
HPE Discovery
Das Oak Ridge National Laboratory (ORNL) zählt zu den zentralen Einrichtungen des US-Energieministeriums für Hochleistungsrechnen. Nach dem Erfolg von „Frontier“, dem weltweit ersten Exascale-Rechner, folgt nun der nächste Schritt: HPE wird mit „Discovery“ einen Exascale-Supercomputer der zweiten Generation aufbauen. Parallel dazu entsteht mit „Lux“ ein dediziertes KI-System, das Wissenschaftlern in den gesamten USA Zugang zu einer cloudähnlichen, souveränen KI-Infrastruktur ermöglichen soll.
„Discovery schafft die Voraussetzungen für ein neues Niveau an konvergenten HPC-, KI- und Quantum-Fähigkeiten, und Lux erweitert deutlich die dedizierten KI-Kapazitäten, die Wissenschaftlern zur Verfügung stehen“, erklärt Bronson Messer, Director of Science bei der Oak Ridge Leadership Computing Facility. Man erwarte „beispiellose Fortschritte“ in verschiedenen Bereichen der Forschung.
Die Basis von Discovery bildet die neue Plattform HPE Cray Supercomputing GX5000, die erstmals für Exaflops-Leistung mit höherer Packungsdichte entwickelt wurde. Laut HPE benötigen die Racks 25 Prozent weniger Platz als die der Vorgängergeneration.
Das System integriert die nächste Generation des Hochleistungsnetzwerks HPE Slingshot, das auf hohe Bandbreite und geringe Latenz für HPC-, Machine-Learning- und Analytics-Workloads ausgelegt ist. Als Recheneinheiten kommen AMD-EPYC-Prozessoren der nächsten Generation (Codename Venice) und AMD Instinct MI430X GPUs zum Einsatz.
Die Kühlung erfolgt vollständig flüssigkeitsbasiert, um eine optimierte Energieeffizienz zu gewährleisten – ein zunehmend entscheidender Faktor im Exascale-Bereich.
Für das Datenmanagement setzt Discovery auf das neue HPE Cray Supercomputing Storage Systems K3000. Dieses All-Flash-System soll bis zu 300 Prozent mehr Input/Output-Operationen pro Sekunde erreichen als der Vorgänger in Frontier.
Erstmals verwendet HPE in einem Serienprodukt die quelloffene Software Distributed Asynchronous Object Storage (DAOS). Das K3000-System ergänzt damit den bestehenden Speicher HPE Cray Supercomputing Storage Systems E2000, der weiterhin auf das Lustre-Dateisystem setzt.
Das zweite System, Lux, ist speziell für KI-Anwendungen konzipiert. Es basiert auf flüssiggekühlten HPE ProLiant Compute XD685 Servern, die mit AMD Instinct MI355X GPUs, AMD EPYC CPUs und AMD-Pensando-Netzwerktechnologie ausgestattet sind.
Lux soll Forschern einen zentralen, sicheren Zugriff auf eine mandantenfähige KI-Fabrik bieten. Ziel ist eine Plattform, die sowohl für Training als auch für Inferenz optimiert ist und sich wie ein Cloud-Dienst nutzen lässt – allerdings unter direkter Kontrolle des US-Energieministeriums.
Mit Discovery und Lux setzt HPE die Entwicklung im Hochleistungs- und KI-Computing fort. Beide Systeme sollen nicht nur die Leistungsfähigkeit des Oak Ridge National Laboratory erweitern, sondern auch neue Maßstäbe für konvergente Forschung an der Schnittstelle von HPC, KI und Quantencomputing setzen.