Zum Inhalt springen
Auf Lager

NVIDIA RTX PRO 6000 Blackwell Server Edition kaufen

Die universelle Data-Center-GPU auf Blackwell-Basis: 96 GB GDDR7, 24.064 CUDA-Cores und 4 PFLOPS FP4 in einer passiv gekühlten 2-Slot-Karte. Nelpx GmbH liefert, plant und integriert die RTX PRO 6000 Server Edition im DACH-Raum — einzeln oder als fertig bestückten Server, auf Wunsch flüssiggekühlt.

96 GB
GDDR7 mit ECC
4 PFLOPS
FP4 (mit Sparsity)
~1,6 TB/s
Speicherbandbreite
NVIDIA RTX PRO 6000 Blackwell Server Edition 96 GB GPU-Beschleuniger
Preis Ab 11.400 € zzgl. MwSt., konfigurationsabhängig
Einordnung

Was ist die RTX PRO 6000 Blackwell Server Edition?

Die NVIDIA RTX PRO 6000 Blackwell Server Edition ist NVIDIAs universelle Data-Center-GPU für KI und visuelles Computing — eine einzelne Steckkarte, die 96 GB Speicher und volle Blackwell-Rechenleistung in einen Standard-PCIe-Slot bringt.

Anders als ein komplettes DGX-System ist die RTX PRO 6000 Server Edition ein einzelner GPU-Beschleuniger, der sich flexibel in OEM-Server von Dell, HPE, Lenovo, Cisco oder Supermicro einbauen lässt — einzeln oder mehrfach pro Knoten. Damit ist sie der pragmatische Einstieg in lokale, DSGVO-konforme KI: kein Hyperscaler-Budget, sondern eine Karte, die in vorhandene Rack-Server passt.

Technisch basiert sie auf dem vollausgebauten GB202-Blackwell-Chip mit 24.064 CUDA-Cores, 752 Tensor-Cores der 5. Generation und 188 RT-Cores der 4. Generation. Die 96 GB GDDR7-Speicher mit ECC sitzen an einem 512-Bit-Interface und liefern rund 1,6 TB/s Bandbreite. Über die fünfte Generation der Tensor-Cores beherrscht die Karte natives FP4 und erreicht so bis zu 4 PFLOPS KI-Leistung — ideal, um große Sprachmodelle effizient im Speicher zu halten und auszuführen.

Das Kennzeichen der Server Edition ist die passive Kühlung: Die Karte hat keinen eigenen Lüfter, sondern wird vom Luftstrom des Servergehäuses durchströmt. Das macht sie für den Dauerbetrieb in dichten Rack-Umgebungen berechenbar und wartungsarm. Für besonders dichte Multi-GPU-Knoten bietet Nelpx zusätzlich eine flüssiggekühlte Variante an. Hinweis: Die RTX PRO 6000 Blackwell unterliegt als „Controlled"-Produkt US-Exportkontrollen — für den DACH-Raum ist die Lieferung in aller Regel unkritisch.

Auf einen Blick

RTX PRO 6000 Server Edition in Zahlen

Verifizierte Eckdaten der Server Edition — die Basis für jede seriöse Server- und Infrastruktur-Planung.

96 GB
GDDR7 mit ECC
512-Bit-Interface · große Modelle bleiben auf einer Karte
~1,6 TB/s
Speicherbandbreite
1.597 GB/s · speist KI- und Rendering-Workloads
24.064
CUDA-Cores
GB202-Blackwell · 188 SMs (Vollausbau)
752
Tensor-Cores (5. Gen)
natives FP4 · DLSS 4 · Transformer-beschleunigt
4 PF
FP4-KI-Leistung
mit Sparsity · 120 TFLOPS FP32
600 W
Boardpower (max.)
per OEM auf 400–600 W konfigurierbar
PCIe 5.0
×16 · FHFL Dual-Slot
10,5″ · passt in Standard-Rack-Server
4× MIG
GPU-Partitionierung
bis zu 4 isolierte Instanzen à 24 GB
Generationen-Vergleich

RTX PRO 6000 Server Edition vs. RTX 6000 Ada

Wo der Sprung auf Blackwell den Unterschied macht — vor allem bei Speicher und KI-Inference.

Merkmal RTX PRO 6000 Server (Blackwell) RTX 6000 Ada Generation
ArchitekturBlackwell (GB202)Ada Lovelace (AD102)
GPU-Speicher96 GB GDDR7 ECC48 GB GDDR6 ECC
Speicherbandbreite~1,6 TB/s~0,96 TB/s
CUDA-Cores24.06418.176
KI-PräzisionFP4 / FP8 / FP16 (5. Gen Tensor)FP8 / FP16 (4. Gen Tensor)
FP4-KI-Leistungbis 4 PFLOPSkein natives FP4
Boardpowerbis 600 W300 W
StärkeLLM-Inference & Fine-Tuning bis ~70B, 96 GB für große ModelleAllround-Workstation, leichtes KI-Training

Quellen: NVIDIA Produktseite RTX PRO 6000 Blackwell Server Edition, Lenovo ThinkSystem Product Guide (lp2263) und PNY-Datenblatt. Werte können je nach finaler OEM-Konfiguration variieren. Nelpx verifiziert die Zielspezifikation vor jedem Angebot.

Der Mehrwert

Warum die RTX PRO 6000 Server Edition besonders ist

Sie verbindet drei Eigenschaften, die sie zur vielseitigsten Single-Card-GPU für Unternehmens-Rechenzentren machen — von KI bis Rendering.

01 — Speicher

96 GB GDDR7 auf einer Karte

96 GB Speicher mit ECC bedeuten, dass große Sprachmodelle, lange Kontexte und umfangreiche KV-Caches direkt auf einer einzigen GPU bleiben — ohne aufwändiges Sharding über mehrere Karten. Das entspricht der Kapazität einer H100/H200 und genügt für lokale Inference von Modellen bis in den zweistelligen Milliarden-Parameter-Bereich. Genau das senkt Latenz, Komplexität und Betriebskosten.

02 — KI-Leistung

FP4 mit 5. Gen Tensor Cores

Die fünfte Generation der Tensor-Cores beherrscht natives FP4 und liefert bis zu 4 PFLOPS KI-Leistung. Gegenüber der Vorgängergeneration RTX 6000 Ada vervielfacht das die Inference-Geschwindigkeit: Moderne Engines wie TensorRT-LLM nutzen FP4, um den Token-Durchsatz zu maximieren und mehr Modell in denselben Speicher zu packen — bei kaum messbarem Qualitätsverlust.

03 — Vielseitigkeit

KI und visuelles Computing in einem

Dieselbe Karte beschleunigt LLM-Inference, Datenanalyse, Rendering, Omniverse-Simulation und Video-Verarbeitung mit 4:2:2. 188 RT-Cores der 4. Generation und neun NVENC/NVDEC-Engines machen sie zur universellen GPU für gemischte Workloads — ein Server, der tagsüber rendert und nachts inferiert, statt zwei spezialisierte Systeme.

04 — Integration

Passt in Standard-Rack-Server

Als passiv gekühlte FHFL-Dual-Slot-Karte mit PCIe 5.0 fügt sich die Server Edition in vorhandene 2U/4U-Server ein — einzeln oder mehrfach. Kein proprietäres Chassis, keine Spezial-Infrastruktur. Mit MIG lässt sie sich zudem in bis zu vier isolierte Instanzen teilen und so von mehreren Teams gleichzeitig nutzen.

Worauf es ankommt

600 W passiv — Server-Airflow richtig planen

Die Server Edition hat bewusst keinen eigenen Lüfter. Ihre Leistung ist nur dann stabil abrufbar, wenn das Servergehäuse genug Druck-Luftstrom liefert und die Stromversorgung dimensioniert ist. Genau hier liegt der Mehrwert von Nelpx als Systemhaus.

Airflow
Passiv = Chassis-Sache
Die Karte braucht zertifizierten Server-Luftstrom. Wir prüfen die Plattform-Freigabe vor Bestellung.
Strom
Bis 600 W pro Karte
Boardpower per OEM auf 400–600 W konfigurierbar — wichtig bei 4+ Karten pro Knoten und PSU-Budget.
Dichte
Multi-GPU pro Server
Mehrere Karten pro Knoten erhöhen Wärmelast. Bei hoher Dichte ist die flüssiggekühlte Variante die Antwort.
Standort
Facility-Check DACH
Standortbewertung für Strom, Kühlung und Netzanbindung in DE/AT/CH.
Optional

Auch flüssiggekühlt verfügbar

Für besonders dichte Multi-GPU-Knoten und Rechenzentren mit Warmwasser-Kreislauf bieten wir die RTX PRO 6000 Server Edition in einer flüssiggekühlten Ausführung an. Direkt-Flüssigkühlung (DLC) führt die Abwärme effizienter ab als Luft, senkt Lüfterenergie und Geräusch und erlaubt mehr Karten pro Höheneinheit — bei stabilen Temperaturen unter Dauerlast.

  • Höhere GPU-Dichte pro Rack bei gleichem Temperaturbudget
  • Geringerer Kühlenergiebedarf und niedrigere PUE
  • Stabile Dauerlast-Performance ohne thermisches Throttling
  • Ideal für vorhandene DLC- oder Rear-Door-Heat-Exchanger-Infrastruktur
Flüssigkühlung anfragen
Flüssiggekühlte Variante der NVIDIA RTX PRO 6000 Blackwell Server Edition mit DLC-Kühlplatte
Einsatzszenarien

Wofür die RTX PRO 6000 Server Edition eingesetzt wird

Viel Speicher, native FP4-Leistung und Blackwell-Grafik machen sie zur universellen Karte für KI- und Visual-Computing-Workloads.

LLM-Inference & RAG

Große Sprachmodelle und Retrieval-Augmented-Generation im Produktivbetrieb. 96 GB halten Modell und KV-Cache auf einer Karte, FP4 maximiert den Token-Durchsatz — ideal für agentische, latenzkritische Anwendungen bis ca. 70B Parametern.

Fine-Tuning & LoRA

Fine-Tuning, LoRA/QLoRA und Alignment auf eigenen Daten für Modelle im 70B-Bereich. Eine einzelne Server-Edition-Karte ist eine kosteneffiziente Plattform, um domänenspezifische Modelle on-prem anzupassen.

Wissenschaft & HPC

Molekulardynamik, computergestützte Chemie und CUDA-beschleunigte Forschungs-Libraries profitieren von Speicherkapazität und Blackwell-Tensor-Durchsatz — eine zugängliche Karte für Forschungsgruppen und Institute.

Private & souveräne KI

On-Premises-KI für Unternehmen und öffentliche Hand, die Daten nicht in fremde Clouds geben dürfen. Volle Kontrolle über Modelle, Daten und Standort — DSGVO-konform im eigenen Rechenzentrum.

Rendering & Omniverse

188 RT-Cores der 4. Generation beschleunigen Redshift, V-Ray, Arnold, Blender Cycles und Unreal. Mit 96 GB laufen riesige Szenen, digitale Zwillinge und OpenUSD-Workflows in Omniverse flüssig — auch in 4K/8K.

Video & Multi-Tenant

Vier NVENC- und vier NVDEC-Engines mit 4:2:2-Support beschleunigen Encoding, Streaming und Broadcast. Per MIG lässt sich die Karte in bis zu vier isolierte Instanzen teilen — mehrere Teams oder Dienste teilen sich eine GPU mit garantierter Isolierung.

So läuft die Beschaffung

In vier Schritten zur laufenden RTX PRO 6000

1

Bedarf & Workload

Wir klären Modellgrößen, Inference vs. Rendering und die nötige Kartenzahl — ohne Überdimensionierung.

2

Plattform & Kühlung

Auswahl von Serverplattform und Kühlkonzept (passiv/Server-Airflow oder Flüssigkühlung), inkl. Standortbewertung.

3

Angebot & Lieferung

Konfiguration, Festpreis-Angebot, Beschaffung über unser Partnernetzwerk und Lieferung im DACH-Raum.

4

Integration & Betrieb

Einbau, Inbetriebnahme und Übergabe — auf Wunsch als fertig bestückter Server mit Monitoring und Support.

Sonderkonditionen

Bis zu 15 % für Forschung & öffentliche Hand

Universitäten, Forschungseinrichtungen, Startups und öffentliche Einrichtungen erhalten bei Nelpx besondere Konditionen auf NVIDIA-RTX-PRO-Hardware. Sprechen Sie uns auf Ihr Projekt an — wir kennen die Anforderungen von Tendern und Förderprojekten.

Universitäten Forschungseinrichtungen Startups Öffentliche Hand
Sonderkonditionen anfragen
Häufige Fragen

RTX PRO 6000 Server Edition kaufen — gut zu wissen

Was kostet die NVIDIA RTX PRO 6000 Blackwell Server Edition?
Die RTX PRO 6000 Blackwell Server Edition (96 GB) ist bei Nelpx ab 11.400 € zzgl. MwSt. erhältlich. Der finale Preis hängt von Stückzahl, Serverplattform, Support-Level und Integration ab. Nelpx erstellt ein individuelles Festpreis-Angebot inklusive Lieferung im DACH-Raum. Für Universitäten, Forschungseinrichtungen, Startups und öffentliche Hand sind Sonderkonditionen von bis zu 15 % möglich.
Wie wird die RTX PRO 6000 Server Edition gekühlt?
Die Server Edition ist passiv aufgebaut: Sie hat keinen eigenen Lüfter, sondern wird durch den Luftstrom des Servergehäuses gekühlt und ist für den Dauerbetrieb in 2U/4U-Racks ausgelegt. Die maximale Leistungsaufnahme beträgt 600 W (per OEM auf 400–600 W konfigurierbar). Für besonders dichte Multi-GPU-Knoten bietet Nelpx zusätzlich eine flüssiggekühlte Variante an. Wir planen Stromversorgung, Kühlung und Gehäuse-Airflow als Gesamtsystem.
Was ist der Unterschied zur RTX 6000 Ada und zur Workstation Edition?
Gegenüber der Vorgängergeneration RTX 6000 Ada verdoppelt die RTX PRO 6000 Blackwell den Speicher (96 GB GDDR7 statt 48 GB GDDR6) und liefert dank 5. Gen Tensor Cores mit FP4 ein Vielfaches der KI-Inference-Leistung. Im Vergleich zur Workstation Edition nutzt die Server Edition denselben GB202-Chip und 96 GB Speicher, ist aber passiv gekühlt, für Server-Dauerlast optimiert und auf 600 W Boardpower ausgelegt. Die Speicherbandbreite liegt bei rund 1,6 TB/s.
Liefert Nelpx die RTX PRO 6000 Server Edition im DACH-Raum?
Ja. Als IT-Systemhaus liefert, plant und integriert Nelpx die NVIDIA RTX PRO 6000 Blackwell Server Edition in Deutschland, Österreich und der Schweiz — einzeln oder als bestückten Server. Dazu gehören Plattform-Auswahl, Standortbewertung für Strom und Kühlung sowie Inbetriebnahme.
Für welche Workloads eignet sich die RTX PRO 6000 Server Edition?
Die 96 GB Speicher und die FP4-Leistung machen sie ideal für KI-Inference und Fine-Tuning von Modellen bis ca. 70B Parametern, RAG-Anwendungen, agentische KI, Datenanalyse sowie visuelles Computing: Rendering, Omniverse, digitale Zwillinge und Video-Verarbeitung mit 4:2:2. Für reines großskaliges Training von Grund auf sind HGX-H100/H200-Systeme weiterhin die stärkere Wahl — wir beraten ergebnisoffen.

Fordern Sie Ihr RTX PRO 6000 Angebot an

Ein kurzer Draht statt langem Formular: Schreiben Sie uns Ihren Bedarf — wir melden uns mit Konfiguration, Plattform-Empfehlung und Festpreis.

DACHDeutsches IT-Systemhaus
< 24 hAntwort auf Anfragen
End-to-EndLieferung & Integration
Angebot anfragen

Kontaktieren Sie uns

Ihre Anfrage wird schnellstmöglich bearbeitet.

Geschützt durch reCAPTCHA, Datenschutzerklärung & Nutzungsbedingungen anwenden.