AMD veröffentlicht von Zeit zu Zeit Fallstudien, in denen der Einsatz von AMDs Produkten in der Praxis dargestellt wird. Jetzt ist eine interessante Fallstudie mit einem faszinierenden Szenario aufgetaucht. Demnach nutzt AMDs Fertigungspartner TSMC für sein Server-Netzwerk und verschiedene Unternehmensbereiche AMD EPYC Server-CPUs, die sie auch selbst für AMD herstellen.

Die Taiwan Semiconductor Manufacturing Company (TSMC) hat als weltweit führende Halbleiterfertigung laut AMD-Fallstudie einen enormen Bedarf an Rechenzentrumsinfrastruktur. Das taiwanische Unternehmen stellt nicht nur die Wafer mit den Mikrochips her, sondern ist auch stark in Forschung und Entwicklung tätig. Die über 50.000 Mitarbeiter weltweit benötigen kompetente IT-Services für Kommunikation und Zusammenarbeit. Als der AMD EPYC Prozessor verfügbar wurde, wurde diesem das Potenzial bescheinigt, Produktivitäts- und Betriebskostenvorteile für alle Teams zu bieten.

„Wir haben AMD EPYC Prozessoren erstmals in die allgemeine Arbeitsabläufe eingeführt“, erklärte Simon Wang, Direktor der Abteilung für Infrastruktur- und Kommunikationsdienste bei TSMC. „Sie werden zusammen mit unserem Forschungs- und Entwicklungsteam eingesetzt.“ TSMC suchte nach einer Serverlösung, die für die Implementierung eines HCI-Designs (Hyper-Converged Infrastructure) optimiert ist, bei dem alle drei Komponenten – Computing, Storage und Networking – von derselben zugrunde liegenden Hardware bereitgestellt werden können. Obwohl TSMC selbst AMDs 7-Nanometer-Produkte herstellt, war dies zuvor nicht der Fall. Dies bedeutet nicht, dass AMDs EPYC-Prozessoren automatisch die bevorzugte Auswahl sein würden.

TSMC muss die Serverdichte in seinen Rechenzentren ausgleichen. „Unsere vorhandenen Rechenzentren sind durch Platz und Strom begrenzt“, meinte Wang. „Wir haben die Virtualisierung von Computer, Speicher und Netzwerk entworfen und implementiert, und das alles als eigenen Standard für die Servicearchitektur. Ich muss Produkte finden, die direkt in diese Standardvorlage eingeführt werden können, und sie dann schnell in unseren Rechenzentren bereitstellen, ohne die Architektur neu zu gestalten. Wir haben zwei virtuelle Maschinen (VM) für unsere Workloads, abhängig von ihrer Komplexität.“ Es ist jedoch nicht optimal, viele VMs auf einem Server auszuführen. „Wenn mein Server 20 Maschinen unterstützt, werden 20 Maschinen getroffen, wenn der Server ausfällt. Aus diesem Grund gibt es zwei Arten von VM-Serverkonfigurationen, um das Risiko zu verringern.“

„Die Kompatibilität war der Schlüsselfaktor, bevor wir mit dem groß angelegten Einsatz [von EPYC] begannen“, erklärt Wang. „In Bezug auf die Leistung hatten wir keine Zweifel. Wir haben [EPYC] mit den wichtigsten Anwendungen getestet und die Leistung war ausgezeichnet. Bei der Herstellung und der allgemeinen Arbeitsbelastung für Supportfunktionen gab es keine Probleme mit der Kompatibilität.“ Die Tests des Unternehmens zeigten vollständige Kompatibilität mit mehreren Linux-Distributionen, Windows-Systemen und Speichervirtualisierung. „Wir nutzen viel Virtualisierungstechnologie und haben dies bereits getestet. Wir starten einen Pilot mit einigen Speichervirtualisierungsprodukten und sie bieten auch zertifizierte AMD EPYC Produkte an.“

Für den allgemeinen Workload-Rollout arbeitete TSMC mit Hewlet Packard Enterprise (HPE) zusammen. „Wir hatten intensive Gespräche mit HPE“, erklärt Wang, „und das AMD-Produkt war sofort verfügbar, um direkt mit unserer vorhandenen Architektur verwendet zu werden, wodurch die Zykluszeit verkürzt wurde. Andernfalls müssen wir mehr Tests durchführen, was die Zeit bis zur Bereitstellung erheblich verlängert.“ TSMC entschied sich für die HPE DL325 G10-Plattform mit der AMD EPYC 7702P-CPU der zweiten Generation (Rome) mit 64 Kernen, einer Basistaktfrequenz von 2 GHz und einem Boost-Takt von bis zu 3,35 GHz.

„2021 werden zwei weitere Rechenzentren implementiert“, erklärt Wang. Eines in Tainan im Süden Taiwans nahe der Chipfabriken, das andere in beim Hauptquartier in Hsinchu. Für allgemeine Workloads ist die Speicherdichte ein kritischer Aspekt. Aufgrund der Kerndichte pro Prozessor konnten physische Server eingespart werden, wodurch die Verwaltungs- und Stromkosten sowie der im Rechenzentrum erforderliche Speicherplatz reduziert wurden.

TSMC erweitert mittlerweile die Einführung der AMD EPYC Prozessoren im gesamten Unternehmen. „Wir führen jetzt EPYC-Server in unsere Fertigungsteams ein“, sagt Wang. Interessant ist die neue Hochfrequenz-Reihe der AMD EPYC ‚F‘ CPUs, insbesondere der 7F72 mit 24 Kernen und einem Basistakt von 3,2 GHz. „Das ist die CPU, die wir aufgrund der hohen Taktrate für Forschung und Entwicklung in Betracht ziehen. Dieses Team benötigt nicht unbedingt mehr Sockel oder Kerne. Wenn wir für Forschung und Entwicklung zwei Sockets verwenden, kann dies zu unerwarteten Effekten führen, da eine CPU mit einer anderen CPU kommunizieren muss, was zu Overheads führt. Für F&E wählen wir daher ein Einzel-Sockel-System“. Die hohe Taktrate soll dabei ein wichtiger Vorteil sein.

„Für die Automatisierung mit den Maschinen in unserer Fabrik muss jede Maschine über einen x86-Server verfügen, um die Betriebsgeschwindigkeit und die Bereitstellung von Wasser, Strom und Gas oder den Stromverbrauch zu steuern“, fügt Wang hinzu. „Diese Maschinen sind sehr teuer. Sie kosten vielleicht Milliarden von Dollar, aber die Server, die sie steuern, sind viel billiger. Ich muss sicherstellen, dass wir eine hohe Verfügbarkeit haben. Falls ein Rack ausfällt, dann können wir ein anderes Rack verwenden, um die Maschine zu unterstützen. Mit einem Standardbaustein kann ich ungefähr 1000 virtuelle Maschinen generieren, die 1000 Fab-Tools in unserem Reinraum steuern können.“ Dies bedeutet laut AMD eine hohe Kostenersparnis, ohne die Redundanz oder Zuverlässigkeit des Failovers zu beeinträchtigen.

Quelle: AMD