Logo von heise online

Suche
Abonnieren

Tägliche Top-News bei WhatsApp, Facebook Messenger, Telegram & Insta

preisvergleich_weiss

Recherche in 1.508.171 Produkten

Martin Fischer 146

GTC 2017: Nvidia stellt Riesen-GPU Volta mit 5120 Kernen und 16 GByte HBM2 vor

GTC 2017: Nvidia stellt Mega-GPU Volta mit 5120 Kernen vor

Jen-Hsun Huang zeigt die erste Volta-GPU GV100 auf der GTC

Bild: Martin Fischer

Volta besteht aus über 21 Milliarden Transistoren und enthält auf der Tesla V100 5120 Shader-Rechenkerne. Im dritten Quartal 2017 will Nvidia erste Server mit Volta-GPUs ausliefern.

Nvidia-Chef Jen-Hsun Huang hat auf der GPU Technology Conference in San Jose die kommende GPU-Generation Volta vorgestellt. Sie bietet wesentlich mehr Rechenleistung als die aktuelle Pascal-Generation und ist auf Deep-Learning-Berechnungen zugeschnitten. Die von Huang vorgestellte GPU läuft unter der Bezeichnung GV100 und kommt zunächst auf der Profi-Rechenkarte Tesla V100 zum Einsatz.

Anzeige

GV100 besteht aus 21,1 Milliaren Transistoren und wird vom taiwanischen Auftragsfertiger TSMC mit 12-Nanometer-FFN--Strukturen gefertigt. Zwar soll Volta laut Jonah Alben, Vice President of GPU Engineering, auf einer neuen Architektur aufbauen, die Organisation der Funktionseinheiten ähnelt jedoch dem Pascal-Vorgänger GP100. Die Volta-GPU nimmt eine Fläche von 815 mm² ein und enthält 5120 Shader-Rechenkerne auf der Tesla V100. Zusammen erreichen sie eine Rechenleistung von 15 Billionen Gleitkommaoperationen pro Sekunde (TFlops) bei einfacher Genauigkeit und 7,5 TFlops bei doppelter Genauigkeit (Double Precision). Im Vergleich zum Vorgänger GP100 steigt die Rechenleistung um etwa 40 Prozent. Nvidia zufolge besteht die GV100-GPU im Vollausbau aus 5376 Kernen.

Volta GV100: 21,1 Milliarden Transistoren und 5120 Kerne.
Volta GV100: 21,1 Milliarden Transistoren und 5120 Kerne. (Bild: Martin Fischer)

Eine als Tensor-Core bezeichnete, auf Deep-Learning-Computing optimierte Einheit soll via CUDA TensorOp-Instruktionen besonders effizient verarbeiten. Die 640 Tensor-Cores des GV100 sollen auf der Tesla V100 eine Rechenleistung von 120 Tensor-TFlops erreichen. Die Tensor-Cores gewährleisten dabei sowohl beim Training als auch beim Inferencing eine besonders hohe Performance.

Überdies enthält GV100 320 Textureinheiten, ein 20 MByte großes Register File und 16 MByte Cache. Nvidia stattet die Rechenkarte mit 16 GByte High Bandwidth Memory 2 aus, der eine Transferrate von 900 GByte/s erreichen soll und von Samsung gefertigt wird. Ein genaues Datenblatt zu GV100 hat Nvidia auf seiner Developer-Seite veröffentlicht.

Nvidia kündigte ebenfalls einen neuen Deep-Learning-Server mit acht Tesla V100 an. Der DGX-1 soll damit eine theoretische Rechenleistung von 960 Tensor-TFlops erreichen, ab dem dritten Quartal 2017 verfügbar sein und 149.000 US-Dollar kosten. Die kompakte DGX Station enthält vier Tesla V100 und kostet 69.000 US-Dollar. Über NVLink 2.0 können die Tesla-Karten untereinander mit 300 GByte/s kommunizieren.

Tesla K40 Tesla M40 Tesla P100 Tesla V100
GPU GK110 (Kepler) GM200 (Maxwell) GP100 (Pascal) GV100 (Volta)
SMs 15 24 56 80
TPCs 15 24 28 40
FP32 Cores / SM 192 128 64 64
FP32 Cores / GPU 2880 3072 3584 5120
FP64 Cores / SM 64 4 32 32
FP64 Cores / GPU 960 96 1792 2560
Tensor Cores / SM -- -- -- 8
Tensor Cores / GPU -- -- -- 640
GPU Boost Clock 810/875 MHz 1114 MHz 1480 MHz 1455 MHz
Peak FP32 TFLOP/s* 5,04 6,8 10,6 15
Peak FP64 TFLOP/s* 1,68 2,1 5,3 7,5
Peak Tensor Core TFLOP/s* -- -- -- 120
Texture Units 240 192 224 320
Memory Interface 384-bit GDDR5 384-bit GDDR5 4096-bit HBM2 4096-bit HBM2
Memory Size Up to 12 GB Up to 24 GB 16 GB 16 GB
L2 Cache Size 1536 KB 3072 KB 4096 KB 6144 KB
Shared Memory Size / SM 16 KB/32 KB/48 KB 96 KB 64 KB Configurable up to 96 KB
Register File Size / SM 256 KB 256 KB 256 KB 256KB
Register File Size / GPU 3840 KB 6144 KB 14336 KB 20480 KB
TDP 235 Watts 250 Watts 300 Watts 300 Watts
Transistors 7.1 billion 8 billion 15.3 billion 21.1 billion
GPU Die Size 551 mm² 601 mm² 610 mm² 815 mm²
Manufacturing Process 28 nm 28 nm 16 nm FinFET+ 12 nm FFN

(mfi)

146 Kommentare

Themen:

Anzeige
  1. Tesla V100: Nvidia übergibt erste Volta-Rechenkarten an Deep-Learning-Forscher

    Tesla V100: Nvidia übergibt erste Volta-Rechenkarten an Deep-Learning-Forscher

    Nvidia-Chef Jensen Huang hat die ersten Rechenkarten mit Volta-GPUs an Forscher im Bereich der künstlichen Intelligenz überreicht.

  2. GTC 2017: Nvidias Volta-Architektur ein Meilenstein im GPU-Design

    GTC 2017: Volta-Architektur für Anwendungen der Zukunft

    Führende Nvidia-Ingenieure haben sich zu den Neuerungen der Volta-GPU geäußert. Laut Chefentwickler Alben ist Volta mehr als nur ein Aufguß von Pascal, sondern eine völlig neue Architektur.

  3. GTC 2017: CUDA 9 mit vollem Volta-Support und Cooperative Groups

    GTC 2017: CUDA 9 mit vollem Volta-Support und Cooperative Groups

    Die kommende CUDA-Version 9 unterstützt die neue Volta-GPU, erlaubt die Programmierung der Tensor Cores und integriert das neue Programmiermodell Cooperative Groups.

  4. Monster-Grafikkarte Nvidia Titan V: 3100 Euro für 5120 Kerne und 12 GByte Speicher

    Monster-Grafikkarte Nvidia Titan V: 3100 Euro für 5120 Kerne und 12 GByte Speicher

    Mehr als 3000 Euro verlangt Nvidia für die neue High-End-Grafikkarte Titan V. Es ist die erste Consumer-Grafikkarte mit Volta-Grafikchip, der eine hohe Rechen- und Spieleleistung gleichermaßen bieten soll.

  1. Nvidia: Spielerisch intelligent

    Nvidia: Spielerisch intelligent

    Seit Jahren beweist Nvidia, dass man mit Grafikkarten mehr machen kann, als Ballerspiele zu zocken. Jetzt will das Unternehmen die künstliche Intelligenz entscheidend voranbringen.

  2. Nvidia-CEO über Herausforderungen der KI

    "Wenn es um menschliches Leben geht, gibt es immer regulatorische Herausforderungen"

    Jensen Huang, Chef des Chipkonzerns Nvidia, spricht im Technology-Review-Interview über die Herausforderungen der Künstlichen Intelligenz.

  3. House of ROC: AMDs Alternative zu CUDA

    House of ROC: AMDs alternative zu CUDA

    Mit ROCr und ROCm möchte AMD den Platzhirsch Nvidia und dessen CUDA herausfordern. Die Ansätze sind vielversprechend, aber an einigen Stellen muss das Unternehmen noch nacharbeiten.

  1. Kryptowährung: Apple lässt gefälschte Wallet-App in App Store

    Kryptowährung: Apple lässt gefälschte Wallet-App in App Store

    Im Hype um Kryptowährungen hat die für über 5 Euro gehandelte iPhone-App “MyEtherWallet” offenbar zahlreiche Kunden gefunden – allerdings steckt dahinter nicht der tatsächliche Anbieter der gleichnamigen Ethereum-Wallet.

  2. Android 8.1 zeigt Geschwindigkeit öffentlicher Netzwerke an

    Android 8.1 zeigt Geschwindigkeit öffentlicher Netzwerke an

    Android zeigt ab Version 8.1 nicht mehr nur die Signalstärke WLANs an, sondern auch die erwartete Surfgeschwindigkeit in vier Stufen. Die Neuerung funktioniert nur bei öffentlichen Netzwerken.

  3. Trump und die Forschung: Medizin-Nobelpreisträger kritisiert US-Regierung

    Trump und die Forschung: Medizin-Nobelpreisträger kritisiert US-Regierung

    Der Nobelpreisträger Michael Rosbash nutzte seine Dankesrede auf dem Nobelbankett in Stockholm dazu, vor Beschränkungen der Wissenschaft zu warnen. Dabei kritisierte er indirekt US-Präsident Donald Trump.

  4. Mercedes-Maybach 6 Cabriolet

    Mercedes-Maybach 6 Cabriolet

    Die Leistungsschau der Marke Mercedes-Maybach war auf dem Pebble Beach Concours D’Élégance in Monterey zu sehen. Das Mercedes-Maybach 6 Cabriolet zeigt, was passiert, wenn die Schwaben all das, was sie können, auch wirklich sollen

Anzeige