(Auszug aus der Pressemitteilung)
Supermicro, Inc. (NASDAQ: SMCI), ein Anbieter von IT-Gesamtlösungen für KI, Cloud, Storage und 5G/Edge, kündigt in Zusammenarbeit mit NVIDIA den Ausbau seiner Fertigungs- und Flüssigkeitskühlungskapazitäten an, um frühzeitige Bereitstellungen von Rechenzentrumsplattformen im großen Maßstab zu ermöglichen, die für die neu vorgestellten NVIDIA Vera-Rubin- und Rubin-Plattformen optimiert sind. Dank der beschleunigten Entwicklung und der Zusammenarbeit mit NVIDIA ist Supermicro einzigartig positioniert, um die Flaggschiff-Systeme NVIDIA Vera Rubin NVL72 und NVIDIA HGX Rubin NVL8 schnell einzusetzen. Der bewährte Ansatz von Supermicro für Data Center Building Block Solutions (DCBBS) sorgt für eine optimierte Produktion, umfangreiche Anpassungsmöglichkeiten und eine schnellere Bereitstellung, wodurch Kunden einen Wettbewerbsvorteil durch die KI-Infrastruktur der nächsten Generation erhalten.
„Die langjährige Partnerschaft von Supermicro mit NVIDIA und unsere agilen Building Block Solutions ermöglichen es uns, die fortschrittlichsten KI-Plattformen schneller als andere auf den Markt zu bringen”, sagte Charles Liang, President und CEO von Supermicro. „Mit unserer erweiterten Fertigungskapazität und unserer branchenführenden Expertise im Bereich Flüssigkeitskühlung ermöglichen wir Hyperscalern und Unternehmen die Bereitstellung der NVIDIA Vera Rubin- und Rubin-Plattforminfrastruktur in großem Maßstab mit höchster Geschwindigkeit, Effizienz und Zuverlässigkeit.”
NVIDIA Vera Rubin NVL72 SuperCluster: Das Rack-Scale-System vereint 72 NVIDIA Rubin-GPUs und 36 NVIDIA Vera-CPUs, NVIDIA ConnectX-9 SuperNICs und NVIDIA BlueField-4 DPUs in einer kohärenten Plattform mit NVIDIA NVLink 6 und lässt sich mit NVIDIA Quantum-X800 InfiniBand und NVIDIA Spectrum-X Ethernet skalieren, um die industrielle KI-Revolution voranzutreiben. Es bietet eine Leistung von 3,6 Exaflops NVFP4, eine Bandbreite von 1,4 PB/s HBM4 und 75 TB schnellen Speicher. Die Implementierung von Supermicro basiert auf der NVIDIA MGX-Rack-Architektur der 3. Generation für verbesserte Wartungsfreundlichkeit, Zuverlässigkeit und Verfügbarkeit und umfasst einen verbesserten Technologie-Stack für die Flüssigkeitskühlung im Rechenzentrumsmaßstab mit In-Row-Kühlmittelverteilungseinheiten (Coolant Distribution Units, CDUs). Dies ermöglicht einen skalierbaren Warmwasserkühlungsbetrieb, der den Energieverbrauch und Wasserverbrauch minimiert und gleichzeitig die Dichte und Effizienz maximiert.
2HE flüssigkeitsgekühlte Systeme NVIDIA HGX Rubin NVL8: Diese kompakten 8-GPU-Systeme sind für KI- und HPC-Workloads optimiert und bieten Unternehmen eine sehr leistungsstarke und effiziente Lösung für KI-Workloads in großem Maßstab mit 400 Petaflops NVFP4, 176 TB/s HBM4-Bandbreite, 28,8 TB/s NVLink-Bandbreite und 1600 Gb/s NVIDIA ConnectX-9-Netzwerk-SuperNICs. Supermicro bietet ein Rack-Scale-Design mit maximaler Flexibilität bei der Bereitstellung und Konfigurationsoptionen, die Flaggschiff-x86-CPUs wie Intel Xeon- oder AMD EPYC-Prozessoren der nächsten Generation unterstützen. Zu den verfügbaren Optionen gehört ein hochdichtes 2HE-Busbar-Design für eine optimale Rack-Integration mit der branchenführenden fortschrittlichen Direct Liquid Cooling (DLC)-Technologie von Supermicro.
Leistungsmerkmale der NVIDIA Vera-Rubin-Plattform im Überblick
- NVIDIA NVLink 6: Hochgeschwindigkeitsverbindungen, die eine beispiellose Kommunikation zwischen GPU und GPU sowie zwischen CPU und GPU für das Training und die Inferenz umfangreicher Mixture-of-Experts-Modelle ermöglichen.
- NVIDIA Vera CPU: Von NVIDIA entwickelte benutzerdefinierte Arm-Kerne bieten eine doppelt so hohe Leistung wie die Vorgängergeneration, mit räumlichem Multithreading (88 Kerne/176 Threads), einer LPDDR5X-Speicherbandbreite von 1,2 TB/s mit dreifacher Kapazität und einer NVLink-C2C-Bandbreite von 1,8 TB/s zu GPUs (doppelt so viel wie zuvor).
- Transformator der 3. Generation: Optimierte Beschleunigung für die Verarbeitung von Workloads mit langem Kontext und Berechnungen mit geringer Genauigkeit, die für die Skalierung moderner KI-Workloads entscheidend sind.
- Confidential Computing der 3. Generation: Bietet Confidential Computing im Rack-Maßstab mit einer einheitlichen, vertrauenswürdigen Ausführungsumgebung auf GPU-Ebene, die Modelle, Daten und Eingabeaufforderungen schützt und isoliert.
- RAS Engine der 2. Generation: Erweiterte Funktionen für Zuverlässigkeit, Verfügbarkeit und Wartungsfreundlichkeit, einschließlich Echtzeit-Zustandsprüfungen ohne Ausfallzeiten.
Darüber hinaus profitiert die NVIDIA Vera Rubin-Plattform von der neu angekündigten NVIDIA Spectrum-X Ethernet Photonics-Vernetzung, die auf dem Spectrum-6 Ethernet ASIC (102,4 Tb/s Switching auf TSMC 3 nm mit 200G SerDes Co-Packaged Optics und vollständig gemeinsam genutzten Buffern) basiert. Dies bietet im Vergleich zu herkömmlichen steckbaren Optiken eine 5-fache Energieeffizienz, 10-fache Zuverlässigkeit und 5-fache Anwendungsverfügbarkeit. Zu den verfügbaren Modellen gehören der flüssigkeitsgekühlte SN6800 (409,6 Tb/s CPO, 512x 800G-Ports), SN6810 (102,4 Tb/s CPO, 128x 800G-Ports) und SN6600 (steckbar, 128x 800G-Ports, luft-/flüssigkeitsgekühlt). Ergänzt wird dies durch Supermicro-basierte Storage-Lösungen mit dem Petascale-All-Flash-Storage-Server und dem JBOF-System, die den NVIDIA BlueField -4 DPU unterstützen und eine Vielzahl von Datenmanagement-Lösungen ausführen.
Die strategischen Investitionen von Supermicro in erweiterte Fertigungsanlagen und einen umfassenden End-to-End-Technologie-Stack für Flüssigkeitskühlung dienen speziell dem Streamlining der Produktion und Bereitstellung vollständig flüssigkeitsgekühlter NVIDIA Vera-Rubin- und Rubin-Plattformen. In Kombination mit der modularen Supermicro DCBBS-Architektur beschleunigen diese Fähigkeiten die Bereitstellung und die Zeit bis zur Inbetriebnahme, indem sie eine schnelle Konfiguration, strenge Validierung und nahtlose Skalierung von Plattformen mit hoher Dichte ermöglichen, um Kunden einen Marktvorsprung zu verschaffen.

Neueste Kommentare
20. Januar 2026
18. Januar 2026
18. Januar 2026
11. Januar 2026
11. Januar 2026
8. Januar 2026