Zum Inhalt springen
Projektanfrage & Vorbestellung

NVIDIA Vera Rubin NVL72 kaufen — das Rack als ein KI-Rechner

Die Rubin-Generation als Rack-Scale-Plattform: 72 Rubin-GPUs, 36 Vera-CPUs, 20,7 TB HBM4 und bis zu 3,6 EFLOPS NVFP4-Inferenz in einem flüssiggekühlten Rack. Nelpx GmbH liefert, plant und integriert Ihr System im DACH-Raum — inklusive Strom-, Kühlungs- und Netzwerkkonzept.

72×
Rubin-GPUs pro Rack
20,7 TB
HBM4-GPU-Speicher
3,6 EFLOPS
NVFP4-Inferenz
NVIDIA Vera Rubin NVL72 Rack-Scale-KI-System im flüssiggekühlten Rack
Rack-Scale · Direct Liquid Cooling
Preis Auf Anfrage individuelles Festpreis-Angebot, konfigurationsabhängig
Überblick

Was ist der NVIDIA Vera Rubin NVL72?

Der Vera Rubin NVL72 ist NVIDIAs Rack-Scale-KI-Plattform der Rubin-Generation. Das gesamte Rack arbeitet als ein einziger, verteilter Beschleuniger — 72 Rubin-GPUs und 36 Vera-CPUs sind über NVLink 6 zu einer kohärenten Recheneinheit zusammengeschaltet.

Aufgebaut ist das System aus mehreren flüssiggekühlten Compute-Trays mit je vier Rubin-GPUs und zwei Vera-CPUs, dazu NVLink-Switch-Trays, Power-Shelves und einer DC-Stromschiene. NVIDIA nennt es die dritte Generation des MGX-/Oberon-Rack-Designs, das einen direkten Übergang von der Blackwell-Generation (GB200/GB300 NVL72) ermöglicht.

Jede Rubin-GPU bringt 288 GB HBM4 mit bis zu 22 TB/s Speicherbandbreite und bis zu 50 PFLOPS NVFP4-Inferenz. Auf Rack-Ebene summiert sich das laut NVIDIA auf 20,7 TB HBM4, rund 1,6 PB/s HBM-Bandbreite und bis zu 3,6 EFLOPS NVFP4-Inferenz bzw. etwa 2,5 EFLOPS NVFP4-Training — bei gleichzeitig deutlich niedrigeren Kosten pro Token gegenüber Blackwell.

Eingeordnet bedeutet das: Rubin ist auf Agentic AI, Reasoning-Modelle und große Mixture-of-Experts-Modelle ausgelegt. Der Sprung gegenüber Blackwell liegt vor allem im Speicher (HBM4 statt HBM3e), in der NVFP4-Rechenleistung und in der NVLink-6-Bandbreite — also genau dort, wo die größten Modelle heute an ihre Grenzen stoßen.

Eckdaten

Vera Rubin NVL72 in Zahlen

Verifizierte Rack- und GPU-Kennwerte aus offiziellen NVIDIA-Angaben (CES 2026) sowie der GIGABYTE-GIGAPOD-Spezifikation.

72×
Rubin-GPUs
36× Vera-CPUs pro Rack, NVLink-6-gekoppelt
288 GB
HBM4 pro GPU
bis zu 22 TB/s Speicherbandbreite pro GPU
20,7 TB
HBM4 gesamt
+ 54 TB LPDDR5X CPU-Speicher pro Rack
~1,6 PB/s
HBM4-Bandbreite (Rack)
aggregierte GPU-Speicherbandbreite
3,6 EFLOPS
NVFP4-Inferenz
~2,5 EFLOPS NVFP4-Training (Rack)
50 PFLOPS
NVFP4-Inferenz / GPU
35 PFLOPS NVFP4-Training pro GPU
3,6 TB/s
NVLink 6 pro GPU
~260 TB/s aggregierte Scale-up-Bandbreite
100 %
flüssiggekühlt
ConnectX-9 SuperNIC & BlueField-4 DPU integriert

Quellen: NVIDIA Vera Rubin NVL72 Produktseite & CES-2026-Angaben; GIGABYTE GIGAPOD „AI DLC Rack – NVIDIA Vera Rubin NVL72“. NVFP4-Werte sind dichte (dense) Spitzenwerte; tatsächliche Leistung ist konfigurations- und workloadabhängig. Spezifikationen vorläufig, Änderungen durch NVIDIA vorbehalten.

Generationsvergleich

Vera Rubin NVL72 vs. GB300 NVL72 (Blackwell Ultra)

Gegenüberstellung der Rubin- und der Blackwell-Ultra-Generation auf GPU- und Rack-Ebene.

Merkmal Vera Rubin NVL72 GB300 NVL72 (Blackwell Ultra)
GPU-ArchitekturRubin (2 Compute-Dies, 336 Mrd. Transistoren)Blackwell Ultra
GPUs pro Rack72× Rubin72× Blackwell Ultra
CPU36× Vera (88 Olympus-Arm-Kerne je CPU)36× Grace
Speicher pro GPU288 GB HBM4288 GB HBM3e
Speicherbandbreite / GPUbis zu 22 TB/s~8 TB/s
NVFP4-Inferenz / GPUbis zu 50 PFLOPS~15 PFLOPS (dense FP4)
NVLinkNVLink 6 – 3,6 TB/s pro GPUNVLink 5 – 1,8 TB/s pro GPU
Netzwerk-SuperNICConnectX-9 (1,6 Tb/s / GPU)ConnectX-8 (0,8 Tb/s / GPU)
Kühlung100 % Direkt-FlüssigkühlungDirekt-Flüssigkühlung

Werte gemäß NVIDIA-Angaben (CES 2026) und etablierten Blackwell-Ultra-Datenblättern. FP4-Werte sind dichte Spitzenwerte. Bei abweichenden Drittquellen gilt die NVIDIA-Originalangabe. Änderungen vorbehalten.

Technischer Mehrwert

Warum der Vera Rubin NVL72 besonders ist

Speicher

HBM4 mit 288 GB pro GPU

Der Wechsel von HBM3e auf HBM4 hebt die Speicherbandbreite pro GPU auf bis zu 22 TB/s — fast das Dreifache der Blackwell-Generation. Genau das entscheidet bei großen Modellen, deren Engpass die Speicherbandbreite ist.

Rechenleistung

NVFP4-Transformer-Engine

Bis zu 50 PFLOPS NVFP4-Inferenz pro GPU und 3,6 EFLOPS pro Rack. Eine neue Transformer-Engine mit adaptiver Kompression beschleunigt NVFP4-Inferenz gezielt für Reasoning- und Agentic-AI-Workloads.

Kopplung

NVLink 6 – das Rack als ein Rechner

NVLink 6 verdoppelt die GPU-zu-GPU-Bandbreite auf 3,6 TB/s pro GPU (~260 TB/s aggregiert). Bei tensor-parallelem Serving trillionschwerer Modelle ist diese Bandbreite der entscheidende Skalierungsfaktor.

Effizienz

Niedrigere Kosten pro Token

NVIDIA positioniert Rubin mit bis zu 10× mehr Tokens pro Megawatt und rund einem Zehntel der Token-Kosten gegenüber Blackwell — bei MoE-Training mit etwa einem Viertel der GPU-Anzahl. Effizienz ist auf Flottenebene der eigentliche Hebel.

Infrastruktur & Beratung

Strom, Kühlung, Netzwerk — als Gesamtsystem geplant

Ein Rack-Scale-System ist kein Server, den man einfach einschiebt. Der Vera Rubin NVL72 stellt hohe Anforderungen an die Rechenzentrums-Infrastruktur. Genau hier liegt die Kernleistung von Nelpx.

DLC
Direkt-Flüssigkühlung
100 % flüssiggekühlte Compute-Trays, CDU-Anbindung & FWS-Wasserqualität nach ASHRAE
~200–360 kW
Leistung pro Rack
je nach Integrator-Konfiguration; DC-Stromschiene, Power-Shelves, Redundanz
800G
Scale-out-Netzwerk
Quantum-X800 InfiniBand oder Spectrum-X Ethernet, ConnectX-9 SuperNIC
2,3 m
Rack-Höhe
z. B. GIGAPOD: 1.200×600×2.300 mm, Stellflächen- & Statik-Prüfung

Nelpx bewertet Ihren Standort vorab: Stromzuführung, Rückkühlung/CDU, Wasserqualität, Netzwerk-Fabric, Statik und Stellfläche. So geht das System nach Lieferung ohne Böse Überraschungen produktiv.

Einsatzszenarien

Wofür der Vera Rubin NVL72 gebaut ist

Reasoning & Agentic AI

Mehrstufige Reasoning-Modelle und autonome Agenten mit großen Kontextfenstern — der primäre Designfokus der Rubin-Plattform.

LLM-Inferenz at Scale

Trillionschwere und Mixture-of-Experts-Modelle mit niedrigsten Kosten pro Token für interaktive, latenzkritische Dienste.

Pretraining & Post-Training

Massives Modelltraining mit deutlich weniger GPUs pro Trainingslauf — ideal für Forschung und KI-Modellentwicklung.

Wissenschaft & HPC

Simulation, Modellierung und KI-gestützte Forschung — auf Vera-Rubin-Basis entstehen erste Supercomputer für Wissenschaftszentren.

Souveräne KI

On-Premise-KI-Fabriken im eigenen Rechenzentrum – volle Datenhoheit für Behörden, Forschung und regulierte Branchen im DACH-Raum.

Multi-Tenant & KI-Plattform

GPU-Cloud- und MLOps-Plattformen mit Confidential Computing & RAS-Engine für mandantenfähigen, abgesicherten Betrieb.

Beschaffungsprozess

In vier Schritten zum produktiven System

1

Bedarf & Beratung

Workload, Modellgröße, Skalierung und Zeitrahmen klären. Wir bewerten, ob Vera Rubin oder eine Blackwell-/Alternativ-Konfiguration passt.

2

Infrastruktur-Check

Standortbewertung: Strom, Direkt-Flüssigkühlung/CDU, Netzwerk-Fabric, Statik und Stellfläche — als integriertes Konzept.

3

Angebot & Lieferung

Individuelles Festpreis-Angebot inkl. Hardware, Infrastruktur und Service. Vorbestellung mit Lieferung im DACH-Raum.

4

Integration & Betrieb

Aufbau, Inbetriebnahme, Cluster-Orchestrierung und Übergabe in den produktiven Betrieb — mit laufendem Support.

Sonderkonditionen

Bis zu 15 % für Forschung & öffentliche Hand

Für Universitäten, Forschungseinrichtungen, Startups und die öffentliche Hand bietet Nelpx besondere Konditionen. Sprechen Sie uns auf Förderfähigkeit und Ausschreibungsanforderungen an.

Universitäten Forschungseinrichtungen Startups Öffentliche Hand
Sonderkonditionen anfragen
Fragen & Antworten

Häufige Fragen zum Vera Rubin NVL72

Was kostet ein NVIDIA Vera Rubin NVL72?
Der Preis ist auf Anfrage. Ein Vera-Rubin-NVL72-Rack ist eine Rack-Scale-Plattform; der Endpreis hängt von Konfiguration, Stückzahl, Support-Level sowie der Infrastruktur (Direkt-Flüssigkühlung, Stromversorgung, Netzwerk) ab. Nelpx GmbH erstellt ein individuelles Festpreis-Angebot inklusive Lieferung und Integration im DACH-Raum. Für Universitäten, Forschungseinrichtungen, Startups und öffentliche Hand sind Sonderkonditionen von bis zu 15 % möglich.
Braucht der Vera Rubin NVL72 Flüssigkühlung?
Ja. Der Vera Rubin NVL72 ist als zu 100 % flüssiggekühlte Rack-Scale-Plattform ausgelegt; die Compute-Trays werden über interne Manifolds direkt flüssiggekühlt. Je nach Integrator liegt die Verlustleistung im Bereich von rund 200 bis 360 kW pro Rack, weshalb Direkt-Flüssigkühlung (DLC) und eine entsprechende Stromversorgung zwingend sind. Nelpx plant Strom, Kühlung und Netzwerk als integriertes Gesamtsystem inklusive Standortbewertung.
Was ist der Unterschied zum GB200/GB300 NVL72?
Der Vera Rubin NVL72 ist die Rubin-Generation auf dem Oberon-/MGX-Rack-Design der dritten Generation. Pro GPU stehen 288 GB HBM4 mit bis zu 22 TB/s zur Verfügung (statt HBM3e bei Blackwell), die NVFP4-Inferenzleistung steigt auf bis zu 50 PFLOPS pro GPU, und NVLink 6 verdoppelt die GPU-zu-GPU-Bandbreite auf 3,6 TB/s pro GPU. Auf Rack-Ebene nennt NVIDIA bis zu 3,6 EFLOPS NVFP4-Inferenz und 20,7 TB HBM4. NVIDIA positioniert Rubin mit deutlich niedrigeren Kosten pro Token.
Liefert Nelpx den Vera Rubin NVL72 im DACH-Raum?
Ja. Nelpx GmbH als IT-Systemhaus liefert, plant und integriert NVIDIA-Rack-Scale-Systeme in Deutschland, Österreich und der Schweiz — inklusive Standortbewertung für Strom und Flüssigkühlung, Netzwerkanbindung (Quantum-X800 InfiniBand bzw. Spectrum-X Ethernet) und Inbetriebnahme.
Wann ist der Vera Rubin NVL72 verfügbar?
NVIDIA hat die Rubin-Plattform auf der CES 2026 im Detail vorgestellt; die Auslieferung über Systempartner ist für die zweite Jahreshälfte 2026 vorgesehen. Nelpx nimmt Projektanfragen und Vorbestellungen entgegen und plant parallel die benötigte Infrastruktur, damit das System nach Lieferung zügig produktiv geht.

Vera Rubin NVL72 anfragen

Sichern Sie sich frühzeitig Ihren Platz: Projektanfrage, Infrastruktur-Planung und Vorbestellung aus einer Hand — im gesamten DACH-Raum.

DACH
DE · AT · CH
<24 h
Reaktion auf Anfragen
End-to-End
Lieferung & Integration
Angebot per E-Mail anfragen

Kontaktieren Sie uns

Ihre Anfrage wird schnellstmöglich bearbeitet.

Geschützt durch reCAPTCHA, Datenschutzerklärung & Nutzungsbedingungen anwenden.