KAYTUS errichtet in nur vier Monaten ein flüssigkeitsgekühltes Rechenzentrum mit 100 Serverschränken in Europa

Modulare, schlüsselfertige KAYTUS Lösung verbessert dank Expertenservice vor Ort die Leistung des hochdichten Flüssigkeitskühlungsclusters um 20 % und die Bereitstellungseffizienz um 80 %

(Auszug aus der Pressemitteilung)

IT-Infrastrukturanbieter KAYTUS hat die Bereitstellung großer flüssigkeitsgekühlter KI-Rechenzentren mithilfe seines integrierten Komplettservice beschleunigt und bietet ein umfassendes Rund-um-Paket – von der Installation über die Optimierung bis hin zur Inbetriebnahme. So hat KAYTUS kürzlich in nur vier Monaten die Bereitstellung eines hochdichten, flüssigkeitsgekühlten KI-Rechenzentrums mit 100 Serverschränken in Europa abgeschlossen – 80 % schneller als mittels konventioneller Bereitstellungsmodelle. Durch professionelle Leistungstests, Tuning und Vorort-Optimierungen bzw. – Anpassungen, konnte zudem die Gesamtleistung des Systems um 20 % gesteigert und ein stabiler sowie hocheffizienter Start der Geschäftstätigkeit ermöglicht werden. Dieses beschleunigte und robuste Bereitstellungsverfahren erfüllt die oft straffen Zeitvorgaben für die Errichtung von KI-Infrastrukturen und liefert ein skalierbares Konzept für die Implementierung von hochdichten, flüssigkeitsgekühlten Clustern in ganz Europa.

Anzeige

Der erwähnte europäische Kunde ist ein sogenanntes „Einhorn“ aus dem Infrastrukturbereich und stellt Computing-, Speicher- und Netzwerkdienste für E-Commerce, Fintech sowie digitale Medien bereit. Angesichts steigender KI-Workloads benötigte der Kunde eine rasche Implementierung von KI-Clustern. Dabei waren zeitliche, technologische und ressourcenbezogene Einschränkungen zu berücksichtigen.

Hochdichte, flüssigkeitsgekühlte KI-Cluster: Geschwindigkeit & Performance

Die Bereitstellung des Kunden-Clusters war herausfordernd aufgrund:

  • Anspruchsvoller Implementierung: Um eine hohe Leistungsdichte seines KI-Rechenzentrums zu gewährleisten, wählte der Kunde eine hochdichte Flüssigkeitskühlung als primäre Lösung für das Wärmemanagement. Allerdings erfordert der Einsatz flüssigkeitsgekühlter Infrastruktur mehrere eng miteinander verwobene Technologien. Wichtige Parameter wie die Wärmeaustauschleistung des Sekundärkreislaufs, die Reinheit des Kühlmittels oder die Leckageerkennung und -überwachung müssen präzise konstruiert und aufeinander abgestimmt werden. Zudem sind die umfassende Architekturplanung und Installation des als Rückgrat der thermischen Ableitung wichtigen Rohrleitungsnetzes der Flüssigkeitskühlung hochkomplex und zeitaufwendig – wodurch sich die Komplexität der Bereitstellung und das Implementierungsrisiko erheblich erhöhen.
  • Straffen Zeitplans: Aufgrund der stark gestiegenen Nachfrage nach geleaster Rechenleistung gab der Kunde einen ambitionierten Zeitplan für die Bereitstellung vor. Jede Verzögerung hätte das Risiko von Vertragsauflösungen und erheblichen Umsatzeinbußen erhöht. Daher galt es, so früh wie möglich alle KI-Cluster hochzufahren und die Unternehmensdienstleistungen zu starten. Herkömmliche Bereitstellungsmodelle erfordern in der Regel 10 bis 12 Monate, um ein flüssigkeitsgekühltes KI-Rechenzentrum fertigzustellen. Daher war ein innovativer, hocheffizienter Bereitstellungsansatz notwendig, um die straffen Zeitvorgaben des Kunden zu erfüllen.
  • Hürden bei der Leistungsoptimierung: Nach der Installation der Hardware stellte der Kunde fest, dass die hochmoderne Infrastruktur trotz hoher Investitionen nicht die erwartete Rechenleistung lieferte. Komplexe Abhängigkeiten zwischen Treibern, Firmware und Softwareversionen führten zu latenten Kompatibilitätslücken zwischen Hardware- und Software-Stacks. Zudem beeinträchtigten Faktoren der unteren Systemebene, etwa Zugriffspfade, Speicherzuweisung, E/A-Kanäle und Netzwerkprotokolle, die Leistung zusätzlich. Um das Potenzial der bereitgestellten Infrastruktur voll auszuschöpfen, benötigte der Kunde ein spezialisiertes KAYTUS Team für Leistungsoptimierung, das eine Feinabstimmung auf Systemebene vornahm und die Recheneffizienz maximierte.

KAYTUS Lösungsvorschlag: Integrierter schlüsselfertiger Service

Angesichts der Herausforderungen einer komplexen Flüssigkeitskühlung, kurzer Übergabefristen und einer suboptimalen Leistung nach der Installation, griff KAYTUS auf seinen integrierten schlüsselfertigen Service zurück, der auf modularer Bereitstellung und Expertendienstleistungen basiert. Mit einer kompromisslosen Herangehensweise optimierte KAYTUS die Bedingungen vor Ort und erbrachte maßgeschneiderte Dienstleistungen, um eine hohe Qualität bei der Übergabe und eine effiziente Bereitstellung zu gewährleisten.

Vorgefertigte Elemente beschleunigen Implementierung

Um den ambitionierten Übergabetermin einzuhalten, hat KAYTUS das herkömmliche Bereitstellungsmodell neu definiert und ein vollständig vorgefertigtes Flüssigkeitskühlungssystem auf Cabinet-Ebene konzipiert. Bei diesem Modell werden Systemintegration, Druckprüfung und Kühlmittelaufbereitung für Kernkomponenten, wie flüssigkeitsgekühlten Server, Schnellkupplungen, Verteiler- und Sammelverteiler sowie Kühlmittelverteilereinheiten (CDUs), bereits im Werk vorgenommen und so eine echte „Cabinet-as-a-System”-Architektur mit standardisierten, vorgefertigten Gehäusen realisiert. Vor der Auslieferung wird jeder Serverschrank zahlreichen standardisierten und automatisierten Validierungstests unterzogen, darunter Luftdichtheitsprüfung, Burn-in-Test mit Kühlmittel und Stromzufuhr, intelligente Entleerung und Trocknung sowie Schutz durch Stickstofffüllung. Dadurch kann auf komplexe sekundäre Flüssigkeitskühlungssysteme vor Ort verzichtet werden. Die Serverschränke sind über standardisierte Schnittstellen mit dem primären Flüssigkeitskühlkreislauf des Rechenzentrums verbunden und können nach minimaler Installation vor Ort in Betrieb genommen werden. Verglichen mit konventionellen Bereitstellungsmethoden wird die Installationszeit vor Ort von mehreren Tagen auf wenige Stunden verkürzt. Dieser Ansatz entkoppelt die Clusterbereitstellung von der Infrastruktur im Serverraum und sorgt durch Standardisierung für eine hohe Konsistenz der Bereitstellungsqualität. Das mit 100 Serverschränken ausgestattete, hochdichte, flüssigkeitsgekühlte KI-Rechenzentrum des Kunden wurde schließlich innerhalb von nur vier Monaten erfolgreich fertiggestellt.

Spezialisierte Anpassungen vor Ort garantieren Bereitstellungsqualität

Aufgrund der hohen Komplexität der Installationsumgebung entwickelte und implementierte das KAYTUS Serviceteam während der Bereitstellungsphase mehrere kundenspezifische Komponenten, die eine optimale thermische Leistung und strukturelle Stabilität im gesamten Rechenzentrum ermöglichen. Dank Messungen vor Ort und dreidimensionalen Modellierungen wird zum Beispiel eine präzise Steuerung des Luftstroms ermöglicht. Mithilfe von KAYTUS entwickelter höhenverstellbarer Verbindungswinkel und verstärkter Nivellierfüße wurden Spannungskonzentrationen und Bewegungen der Gehäuse infolge geringfügiger Bodenunebenheiten gemindert. Um die sensiblen Flüssigkeitskühlungsleitungen zu stabilisieren, entwickelte das Team eine mehrstufige Lösung zur Versteifung und Schwingungsdämpfung von Leitungen, um dichte Leitungsführungen unter erhöhten Böden und in Kabelkanälen zu unterstützen. Auf diese Weise wurde sichergestellt, dass die Rohrleitungen über einen langen Zeitraum hinweg sicher positioniert und mechanisch stabil bleiben.

Maximale Konstanz und Leistung der Systemsoftware dank Support

Für die Implementierung von Softwaresystemen bieten die KAYTUS Experten einen umfassenden Support, der die Systeminstallation, Anwendungsvalidierung und Leistungsoptimierung abdeckt. So wird gewährleistet, dass die Systemleistung die Anforderungen erfüllt und alle notwendigen Schritte vor der Inbetriebnahme des Clusters abgeschlossen sind.

Deshalb ersetzte KAYTUS während der Kundeninstallation das konventionelle zentralisierte Modell der Node-by-Node-Bereitstellung durch seine parallele Bereitstellungstechnologie PODsys, die eine zeitgleiche Installation in mehreren Serverschränken ermöglicht. So konnten in nur 40 Minuten 20 Serverschränke und 360 Knoten bereitgestellt werden. Dies entspricht einer Effizienzsteigerung um mehr als das 7,8-Fache gegenüber konventionellen Methoden.

Für die Test- und Optimierungsphase kombinierte KAYTUS die Validierung des Pilotprojekts mit dessen umfassender Überprüfung und schloss die Proof-of-Concept-Tests (POC) für zwei Serverschränke früher als geplant ab. Der POC umfasste die Hardware-Machbarkeit, die System- und Softwarekompatibilität, die erzielte Leistung und die Zuverlässigkeit des Systems. Aufbauend auf diesen Ergebnissen, unterstützte KAYTUS umfassende Netzwerk- und Leistungs-Stresstests auf Node-, Cabinet- und Multi-Cabinet-Ebene. Durch diesen Ansatz konnte die POC-Erfolgsquote um 300 % gesteigert und der gesamte Bereitstellungsprozess erheblich beschleunigt werden.

Basierend auf diesen detaillierten Testergebnissen führte KAYTUS in kritischen Bereichen eine Leistungsoptimierung auf Systemebene durch, darunter die Optimierung von Zugriffspfaden, Speicherzuweisungsmechanismen und des Netzwerkprotokollstacks sowie die Beschleunigung von E/A-Pfaden. Gegenüber den Ergebnissen von Bare-Metal-Baseline-Tests verbesserte sich die Gesamtleistung in repräsentativen Benchmarks wie GEMM (Gleitkommarechenleistung), NCCL (Parallelitäts- und Kommunikationseffizienz) und LLaMA (Trainingsleistung und -effizienz) um 20 %.