Projektanfrage & Vorbestellung

NVIDIA Vera Rubin NVL72 kaufen — das Rack als ein KI-Rechner

Name: NVIDIA Vera Rubin NVL72
Brand: NVIDIA
Availability: PreOrder

Die Rubin-Generation als Rack-Scale-Plattform: 72 Rubin-GPUs, 36 Vera-CPUs, 20,7 TB HBM4 und bis zu 3,6 EFLOPS NVFP4-Inferenz in einem flüssiggekühlten Rack. Nelpx GmbH liefert, plant und integriert Ihr System im DACH-Raum — inklusive Strom-, Kühlungs- und Netzwerkkonzept.

Angebot anfragen Technische Daten (NVIDIA)

72×

Rubin-GPUs pro Rack

20,7 TB

HBM4-GPU-Speicher

3,6 EFLOPS

NVFP4-Inferenz

NVIDIA Vera Rubin NVL72 Rack-Scale-KI-System im flüssiggekühlten Rack

Rack-Scale · Direct Liquid Cooling

Preis Auf Anfrage individuelles Festpreis-Angebot, konfigurationsabhängig

Überblick

Was ist der NVIDIA Vera Rubin NVL72?

Der Vera Rubin NVL72 ist NVIDIAs Rack-Scale-KI-Plattform der Rubin-Generation. Das gesamte Rack arbeitet als ein einziger, verteilter Beschleuniger — 72 Rubin-GPUs und 36 Vera-CPUs sind über NVLink 6 zu einer kohärenten Recheneinheit zusammengeschaltet.

Aufgebaut ist das System aus mehreren flüssiggekühlten Compute-Trays mit je vier Rubin-GPUs und zwei Vera-CPUs, dazu NVLink-Switch-Trays, Power-Shelves und einer DC-Stromschiene. NVIDIA nennt es die dritte Generation des MGX-/Oberon-Rack-Designs, das einen direkten Übergang von der Blackwell-Generation (GB200/GB300 NVL72) ermöglicht.

Jede Rubin-GPU bringt 288 GB HBM4 mit bis zu 22 TB/s Speicherbandbreite und bis zu 50 PFLOPS NVFP4-Inferenz. Auf Rack-Ebene summiert sich das laut NVIDIA auf 20,7 TB HBM4, rund 1,6 PB/s HBM-Bandbreite und bis zu 3,6 EFLOPS NVFP4-Inferenz bzw. etwa 2,5 EFLOPS NVFP4-Training — bei gleichzeitig deutlich niedrigeren Kosten pro Token gegenüber Blackwell.

Eingeordnet bedeutet das: Rubin ist auf Agentic AI, Reasoning-Modelle und große Mixture-of-Experts-Modelle ausgelegt. Der Sprung gegenüber Blackwell liegt vor allem im Speicher (HBM4 statt HBM3e), in der NVFP4-Rechenleistung und in der NVLink-6-Bandbreite — also genau dort, wo die größten Modelle heute an ihre Grenzen stoßen.

Eckdaten

Vera Rubin NVL72 in Zahlen

Verifizierte Rack- und GPU-Kennwerte aus offiziellen NVIDIA-Angaben (CES 2026) sowie der GIGABYTE-GIGAPOD-Spezifikation.

72×

Rubin-GPUs

36× Vera-CPUs pro Rack, NVLink-6-gekoppelt

288 GB

HBM4 pro GPU

bis zu 22 TB/s Speicherbandbreite pro GPU

20,7 TB

HBM4 gesamt

+ 54 TB LPDDR5X CPU-Speicher pro Rack

~1,6 PB/s

HBM4-Bandbreite (Rack)

aggregierte GPU-Speicherbandbreite

3,6 EFLOPS

NVFP4-Inferenz

~2,5 EFLOPS NVFP4-Training (Rack)

50 PFLOPS

NVFP4-Inferenz / GPU

35 PFLOPS NVFP4-Training pro GPU

3,6 TB/s

NVLink 6 pro GPU

~260 TB/s aggregierte Scale-up-Bandbreite

100 %

flüssiggekühlt

ConnectX-9 SuperNIC & BlueField-4 DPU integriert

Quellen: NVIDIA Vera Rubin NVL72 Produktseite & CES-2026-Angaben; GIGABYTE GIGAPOD „AI DLC Rack – NVIDIA Vera Rubin NVL72“. NVFP4-Werte sind dichte (dense) Spitzenwerte; tatsächliche Leistung ist konfigurations- und workloadabhängig. Spezifikationen vorläufig, Änderungen durch NVIDIA vorbehalten.

Generationsvergleich

Vera Rubin NVL72 vs. GB300 NVL72 (Blackwell Ultra)

Gegenüberstellung der Rubin- und der Blackwell-Ultra-Generation auf GPU- und Rack-Ebene.

Merkmal	Vera Rubin NVL72	GB300 NVL72 (Blackwell Ultra)
GPU-Architektur	Rubin (2 Compute-Dies, 336 Mrd. Transistoren)	Blackwell Ultra
GPUs pro Rack	72× Rubin	72× Blackwell Ultra
CPU	36× Vera (88 Olympus-Arm-Kerne je CPU)	36× Grace
Speicher pro GPU	288 GB HBM4	288 GB HBM3e
Speicherbandbreite / GPU	bis zu 22 TB/s	~8 TB/s
NVFP4-Inferenz / GPU	bis zu 50 PFLOPS	~15 PFLOPS (dense FP4)
NVLink	NVLink 6 – 3,6 TB/s pro GPU	NVLink 5 – 1,8 TB/s pro GPU
Netzwerk-SuperNIC	ConnectX-9 (1,6 Tb/s / GPU)	ConnectX-8 (0,8 Tb/s / GPU)
Kühlung	100 % Direkt-Flüssigkühlung	Direkt-Flüssigkühlung

Werte gemäß NVIDIA-Angaben (CES 2026) und etablierten Blackwell-Ultra-Datenblättern. FP4-Werte sind dichte Spitzenwerte. Bei abweichenden Drittquellen gilt die NVIDIA-Originalangabe. Änderungen vorbehalten.

Technischer Mehrwert

Warum der Vera Rubin NVL72 besonders ist

Speicher

HBM4 mit 288 GB pro GPU

Der Wechsel von HBM3e auf HBM4 hebt die Speicherbandbreite pro GPU auf bis zu 22 TB/s — fast das Dreifache der Blackwell-Generation. Genau das entscheidet bei großen Modellen, deren Engpass die Speicherbandbreite ist.

Rechenleistung

NVFP4-Transformer-Engine

Bis zu 50 PFLOPS NVFP4-Inferenz pro GPU und 3,6 EFLOPS pro Rack. Eine neue Transformer-Engine mit adaptiver Kompression beschleunigt NVFP4-Inferenz gezielt für Reasoning- und Agentic-AI-Workloads.

Kopplung

NVLink 6 – das Rack als ein Rechner

NVLink 6 verdoppelt die GPU-zu-GPU-Bandbreite auf 3,6 TB/s pro GPU (~260 TB/s aggregiert). Bei tensor-parallelem Serving trillionschwerer Modelle ist diese Bandbreite der entscheidende Skalierungsfaktor.

Effizienz

Niedrigere Kosten pro Token

NVIDIA positioniert Rubin mit bis zu 10× mehr Tokens pro Megawatt und rund einem Zehntel der Token-Kosten gegenüber Blackwell — bei MoE-Training mit etwa einem Viertel der GPU-Anzahl. Effizienz ist auf Flottenebene der eigentliche Hebel.

Infrastruktur & Beratung

Strom, Kühlung, Netzwerk — als Gesamtsystem geplant

Ein Rack-Scale-System ist kein Server, den man einfach einschiebt. Der Vera Rubin NVL72 stellt hohe Anforderungen an die Rechenzentrums-Infrastruktur. Genau hier liegt die Kernleistung von Nelpx.

DLC

Direkt-Flüssigkühlung

100 % flüssiggekühlte Compute-Trays, CDU-Anbindung & FWS-Wasserqualität nach ASHRAE

~200–360 kW

Leistung pro Rack

je nach Integrator-Konfiguration; DC-Stromschiene, Power-Shelves, Redundanz

800G

Scale-out-Netzwerk

Quantum-X800 InfiniBand oder Spectrum-X Ethernet, ConnectX-9 SuperNIC

2,3 m

Rack-Höhe

z. B. GIGAPOD: 1.200×600×2.300 mm, Stellflächen- & Statik-Prüfung

Nelpx bewertet Ihren Standort vorab: Stromzuführung, Rückkühlung/CDU, Wasserqualität, Netzwerk-Fabric, Statik und Stellfläche. So geht das System nach Lieferung ohne Böse Überraschungen produktiv.

Einsatzszenarien

Wofür der Vera Rubin NVL72 gebaut ist

Reasoning & Agentic AI

Mehrstufige Reasoning-Modelle und autonome Agenten mit großen Kontextfenstern — der primäre Designfokus der Rubin-Plattform.

LLM-Inferenz at Scale

Trillionschwere und Mixture-of-Experts-Modelle mit niedrigsten Kosten pro Token für interaktive, latenzkritische Dienste.

Pretraining & Post-Training

Massives Modelltraining mit deutlich weniger GPUs pro Trainingslauf — ideal für Forschung und KI-Modellentwicklung.

Wissenschaft & HPC

Simulation, Modellierung und KI-gestützte Forschung — auf Vera-Rubin-Basis entstehen erste Supercomputer für Wissenschaftszentren.

Souveräne KI

On-Premise-KI-Fabriken im eigenen Rechenzentrum – volle Datenhoheit für Behörden, Forschung und regulierte Branchen im DACH-Raum.

Multi-Tenant & KI-Plattform

GPU-Cloud- und MLOps-Plattformen mit Confidential Computing & RAS-Engine für mandantenfähigen, abgesicherten Betrieb.

Beschaffungsprozess

In vier Schritten zum produktiven System

Bedarf & Beratung

Workload, Modellgröße, Skalierung und Zeitrahmen klären. Wir bewerten, ob Vera Rubin oder eine Blackwell-/Alternativ-Konfiguration passt.

Infrastruktur-Check

Standortbewertung: Strom, Direkt-Flüssigkühlung/CDU, Netzwerk-Fabric, Statik und Stellfläche — als integriertes Konzept.

Angebot & Lieferung

Individuelles Festpreis-Angebot inkl. Hardware, Infrastruktur und Service. Vorbestellung mit Lieferung im DACH-Raum.

Integration & Betrieb

Aufbau, Inbetriebnahme, Cluster-Orchestrierung und Übergabe in den produktiven Betrieb — mit laufendem Support.

Sonderkonditionen

Bis zu 15 % für Forschung & öffentliche Hand

Für Universitäten, Forschungseinrichtungen, Startups und die öffentliche Hand bietet Nelpx besondere Konditionen. Sprechen Sie uns auf Förderfähigkeit und Ausschreibungsanforderungen an.

Universitäten Forschungseinrichtungen Startups Öffentliche Hand

Sonderkonditionen anfragen

Fragen & Antworten

Häufige Fragen zum Vera Rubin NVL72

Was kostet ein NVIDIA Vera Rubin NVL72?

Der Preis ist auf Anfrage. Ein Vera-Rubin-NVL72-Rack ist eine Rack-Scale-Plattform; der Endpreis hängt von Konfiguration, Stückzahl, Support-Level sowie der Infrastruktur (Direkt-Flüssigkühlung, Stromversorgung, Netzwerk) ab. Nelpx GmbH erstellt ein individuelles Festpreis-Angebot inklusive Lieferung und Integration im DACH-Raum. Für Universitäten, Forschungseinrichtungen, Startups und öffentliche Hand sind Sonderkonditionen von bis zu 15 % möglich.

Braucht der Vera Rubin NVL72 Flüssigkühlung?

Ja. Der Vera Rubin NVL72 ist als zu 100 % flüssiggekühlte Rack-Scale-Plattform ausgelegt; die Compute-Trays werden über interne Manifolds direkt flüssiggekühlt. Je nach Integrator liegt die Verlustleistung im Bereich von rund 200 bis 360 kW pro Rack, weshalb Direkt-Flüssigkühlung (DLC) und eine entsprechende Stromversorgung zwingend sind. Nelpx plant Strom, Kühlung und Netzwerk als integriertes Gesamtsystem inklusive Standortbewertung.

Was ist der Unterschied zum GB200/GB300 NVL72?

Der Vera Rubin NVL72 ist die Rubin-Generation auf dem Oberon-/MGX-Rack-Design der dritten Generation. Pro GPU stehen 288 GB HBM4 mit bis zu 22 TB/s zur Verfügung (statt HBM3e bei Blackwell), die NVFP4-Inferenzleistung steigt auf bis zu 50 PFLOPS pro GPU, und NVLink 6 verdoppelt die GPU-zu-GPU-Bandbreite auf 3,6 TB/s pro GPU. Auf Rack-Ebene nennt NVIDIA bis zu 3,6 EFLOPS NVFP4-Inferenz und 20,7 TB HBM4. NVIDIA positioniert Rubin mit deutlich niedrigeren Kosten pro Token.

Liefert Nelpx den Vera Rubin NVL72 im DACH-Raum?

Ja. Nelpx GmbH als IT-Systemhaus liefert, plant und integriert NVIDIA-Rack-Scale-Systeme in Deutschland, Österreich und der Schweiz — inklusive Standortbewertung für Strom und Flüssigkühlung, Netzwerkanbindung (Quantum-X800 InfiniBand bzw. Spectrum-X Ethernet) und Inbetriebnahme.

Wann ist der Vera Rubin NVL72 verfügbar?

NVIDIA hat die Rubin-Plattform auf der CES 2026 im Detail vorgestellt; die Auslieferung über Systempartner ist für die zweite Jahreshälfte 2026 vorgesehen. Nelpx nimmt Projektanfragen und Vorbestellungen entgegen und plant parallel die benötigte Infrastruktur, damit das System nach Lieferung zügig produktiv geht.

Vera Rubin NVL72 anfragen

Sichern Sie sich frühzeitig Ihren Platz: Projektanfrage, Infrastruktur-Planung und Vorbestellung aus einer Hand — im gesamten DACH-Raum.

DACH

DE · AT · CH

<24 h

Reaktion auf Anfragen

End-to-End

Lieferung & Integration

Angebot per E-Mail anfragen

Kontaktieren Sie uns

Ihre Anfrage wird schnellstmöglich bearbeitet.

Weitere Themen

Unsere Produkte

HPC Systeme

Künstliche Intelligenz

Folgen Sie uns

Über uns

Karriere

Spenden

Folgen Sie uns

NVIDIA Vera Rubin NVL72 kaufen — das Rack als ein KI-Rechner

Was ist der NVIDIA Vera Rubin NVL72?

Vera Rubin NVL72 in Zahlen

Vera Rubin NVL72 vs. GB300 NVL72 (Blackwell Ultra)

Warum der Vera Rubin NVL72 besonders ist

HBM4 mit 288 GB pro GPU

NVFP4-Transformer-Engine

NVLink 6 – das Rack als ein Rechner

Niedrigere Kosten pro Token

Strom, Kühlung, Netzwerk — als Gesamtsystem geplant

Wofür der Vera Rubin NVL72 gebaut ist

Reasoning & Agentic AI

LLM-Inferenz at Scale

Pretraining & Post-Training

Wissenschaft & HPC

Souveräne KI

Multi-Tenant & KI-Plattform

In vier Schritten zum produktiven System

Bedarf & Beratung

Infrastruktur-Check

Angebot & Lieferung

Integration & Betrieb

Bis zu 15 % für Forschung & öffentliche Hand

Häufige Fragen zum Vera Rubin NVL72

Vera Rubin NVL72 anfragen

NVIDIA Vera Rubin NVL72 kaufen — das Rack als ein KI-Rechner

Was ist der NVIDIA Vera Rubin NVL72?

Vera Rubin NVL72 in Zahlen

Vera Rubin NVL72 vs. GB300 NVL72 (Blackwell Ultra)

Warum der Vera Rubin NVL72 besonders ist

HBM4 mit 288 GB pro GPU

NVFP4-Transformer-Engine

NVLink 6 – das Rack als ein Rechner

Niedrigere Kosten pro Token

Strom, Kühlung, Netzwerk — als Gesamtsystem geplant

Wofür der Vera Rubin NVL72 gebaut ist

Reasoning & Agentic AI

LLM-Inferenz at Scale

Pretraining & Post-Training

Wissenschaft & HPC

Souveräne KI

Multi-Tenant & KI-Plattform

In vier Schritten zum produktiven System

Bedarf & Beratung

Infrastruktur-Check

Angebot & Lieferung

Integration & Betrieb

Bis zu 15 % für Forschung & öffentliche Hand

Häufige Fragen zum Vera Rubin NVL72

Vera Rubin NVL72 anfragen

Kontaktieren Sie uns