(Auszug aus der Pressemitteilung)
Jede Antwort einer KI, egal ob Chatbot, Bildgenerator oder Analyse, muss berechnet werden. Dieser Schritt, das Ausführen trainierter KI-Modelle, heißt Inferenz und verschlingt heute den größten Teil der laufenden Kosten. Bislang mussten Betreiber dabei zwischen zwei Übeln wählen: schnelle KI war teuer, günstige KI war langsam. Diesen Zielkonflikt löst der deutsch-amerikanische KI-Chipentwickler Tensordyne mit seinem heute vorgestellten System Tensordyne Napier auf. Der Ansatz: Statt das Leistungsproblem mit immer größeren, energiehungrigeren Chips zu lösen, setzt Tensordyne an der mathematischen Basis an und ersetzt aufwendige Multiplikationen durch logarithmische Additionen, die auf Chipebene einen Bruchteil an Energie und Zeit kosten.
Schon vor dem Marktstart liegen dem Unternehmen Absichtserklärungen namhafter Cloud- und KI-Infrastrukturbetreiber vor – im Wert von über 200 Millionen US-Dollar. Der Tape-Out, also die Freigabe der Chip-Designdaten an den Auftragsfertiger TSMC, ist nun abgeschlossen. Damit kann im nächsten Schritt die Produktion starten, bei der Tensordyne mit HPE Juniper Networks, Broadcom und TSMC zusammenarbeitet. Für das vierte Quartal 2026 ist zudem eine weitere Finanzierungsrunde (Series-D) geplant. Bislang hat das Unternehmen mehr als 200 Millionen US-Dollar eingesammelt, unter anderem von Celesta Capital, dem Fonds von Intel-CEO Lip-Bu Tan.
Energieeffizienz und Schnelligkeit als Erfolgsfaktoren
Schon heute machen Energiekosten in Deutschland und Europa oft mehr als 30 Prozent der laufenden Betriebskosten eines Rechenzentrums aus – in den USA ist dieser Anteil aufgrund günstigerer Tarife etwas niedriger, bleibt aber auch dort der größte Kostenblock. Mit Agentic AI, Video-Generierung & Co. wird der Energiebedarf von KI in den nächsten Jahren weiter massiv zunehmen. Während US-Anbieter vor allem wegen knapper Netzkapazitäten auf extreme Effizienz trimmen müssen, entscheidet die Effizienz in Europa schlichtweg über die wirtschaftliche Überlebensfähigkeit: Hier zählt im harten Wettbewerb jede Kilowattstunde doppelt. Deshalb scheitern heute zu viele KI-Geschäftsmodelle nicht an der Idee, sondern an den Kosten.
Genau hier setzt Napier an: Ein Rechenzentrum von der Größe eines Basketballfeldes, bestückt mit Napier-Systemen, könnte theoretisch eine Token-Menge generieren, die dem gesamten aktuellen Tagesbedarf Deutschlands entspricht – bei einem Stromverbrauch von rund 12 Megawatt. Herkömmliche Systeme bräuchten dafür sieben Basketballfelder und etwa 100 Megawatt. Anders als die meisten Hochleistungs-KI-Systeme kommt Napier durch seine Architektur zudem mit regulärer Luftkühlung aus und entlastet Strom-, Wasser- und Flächenverbrauch gleichermaßen – Faktoren, die bei der Standortwahl von Rechenzentren zunehmend zur kritischen Größe werden.
Drei technische Besonderheiten des Systems
Tensordyne hat den gesamten Inferenz-Stack neu konzipiert. Drei Innovationen tragen das System:
- TDN Math verwandelt die Multiplikationen, die KI-Modelle massenhaft brauchen, in einfache Additionen – das macht das System schneller und energieeffizienter.
- TDN AIP, der hauseigene KI-Prozessor, kombiniert schnellen SRAM-Speicher und High-Bandwidth-Memory direkt auf dem Chip, sodass Rechenleistung nie brach liegt.
- TDN Link, Tensordynes eigene Verbindungstechnologie, überträgt Daten mit Latenzen unter einer Mikrosekunde und schöpft so die volle Rechenkapazität der Chips aus.
Komplementäre Lösung für bestehende Rechenzentren
Herzstück des Systems ist der Tensordyne Napier Inference Pod (TDN72), in dem 72 Chips zu einer Recheneinheit zusammengeschaltet werden. Ein einzelner Pod übertrifft einen vollen Nvidia-NVL72-Rack und benötigt dabei 75 Prozent weniger Strom und 70 Prozent weniger Stellfläche. Für anspruchsvollste Echtzeit-Anwendungen führt Napier über 1.000 Tokens pro Sekunde bei Modellen mit mehreren billionen Parametern in einem einzigen Rack aus – ein Setup aus Nvidia Rubin und Groq LPX bräuchte dafür mindestens neun Racks. Gegenüber einem Nvidia-Blackwell-System liefert er beim Benchmark DeepSeek-R1:
- 17-fach mehr Tokens pro Watt
- 13-fach mehr Tokens pro Sekunde
- 33 Millionen US-Dollar zusätzlichen Umsatz pro Rack und Jahr
Über Standard-Gehäuse von HPE und Juniper fügt sich das System in bestehende Rechenzentren ein. Die Software-Integration erfolgt mit wenigen Zeilen Code über PyTorch, vLLM und Triton.
Stimmen
Gilles Backhus, Co-Founder von Tensordyne: „Heute scheitern in Europa zu viele KI-Geschäftsmodelle nicht an der Idee, sondern an den Inferenzkosten. Mit Napier sorgen wir dafür, dass Konzerne, Mittelstand und Application-Layer-Startups ihre KI-Produkte hierzulande wirtschaftlich betreiben können.“
Frank Ostojic, Leiter der Spezialchip-Sparte bei Broadcom: „Wir freuen uns sehr über die Partnerschaft mit Tensordyne. Das Team nutzt unsere Kerntechnologien und unser Know-how im Chip-Design, um seinen neuen 3-Nanometer-KI-Chip auf den Markt zu bringen. Damit setzen sie bei Leistung und Energieeffizienz ganz neue Maßstäbe in der Branche.“
Dave Driggers, CEO von Cirrascale: „Mit dem Napier-System von Tensordyne können wir unseren Kunden künftig eine KI-Infrastruktur bieten, die nicht nur extrem leistungsstark, sondern auch hocheffizient und skalierbar ist. Tensordyne macht KI-Anwendungen genau so schnell und bezahlbar, wie der Markt es im Moment dringend braucht.“
Kevin Johnson, Board-Mitglied und Investor bei Tensordyne: „Ich habe bei Juniper miterlebt, wie ein neuer Netzwerk-Standard das Internet erst skalierbar gemacht hat. Bei KI stehen wir an genau dem gleichen Punkt: Die Investitionen sind da – allein bis 2030 fließen rund fünf Billionen US-Dollar in KI-Infrastruktur –, aber ohne einen Effizienzsprung in der Hardware wird daraus kein tragfähiges Geschäftsmodell. Tensordyne liefert diesen Sprung.“
Johnson war zuvor u.a. Leiter des Plattformgeschäfts bei Microsoft und CEO bei Starbucks.




Neueste Kommentare
5. Juni 2026
31. Mai 2026
28. Mai 2026
16. Mai 2026
12. Mai 2026
29. April 2026