GPU-Übersicht - Hardware-Zone

Direkt zum Seiteninhalt
GPU-Übersicht
Die meisten Grafikkarten für den PC sind mit Grafikprozessoren der Geforce-Serie von NVidia oder der Radeon-Serie von AMD ausgestattet, wodurch das Angebot auf den ersten Blick überschaubar erscheint. In der Regel bringt der Entwickler des Grafikprozessors unter eigenem Namen nur ein Referenzmodell der Grafikkarte, die sogenannten Founders Edition, auf den Markt, alle weiteren Modelle werden von anderen Firmen produziert. Aus diesem Grund gibt es sehr viele Anbieter (z.B. Asus, Gainward, MSI, PNY, Sapphire, Zotac), die vom vorgegebenen Design abweichen, Deshalb gibt es die gleiche GPU auch mit unterschiedlichen Taktfrequenzen, Speichergrößen, Kühldungsdesigns und Anschlüssen.

Aktuelle Marktübersicht

Der Markt für Grafikprozessoren im Bereich Gaming (PC-Spiele) wird - von den integrierten Grafikeinheiten einmal abgesehen - mittlerweile dominiert von den beiden Unternehmen AMD (Sitz: Sunnyvale, Kalifornien) und NVidia (Sitz: Santa Clara, ebenda). Gegen Ende der 1990er Jahre gab es noch eine Reihe anderer namhafter Hersteller wie 3dfx (übernommen von NVidia), ATi (übernommen von AMD), S3, Matrox, STMicroelectronics, 3DLabs oder PowerVR. Der harte Wettbewerb um den schnellsten und modernsten Grafikchip (der Begriff GPU wurde erstmals 1999 von NVidia verwendet), immer kürzere Produktlebenszyklen und die damit verbundenen hohen Kosten für Entwicklung und Fertigung führten allerdings dazu, dass diese sich aus dem Gaming-Segment zurückzogen oder von Konkurrenten aufgekauft wurden. Deshalb lassen die Firmen heutzutage ihre Grafikchips auch von Auftragsfertigern wie TSMC oder Globalfoundries produzieren. AMD vermarktet seine GPUs unter der Bezeichnung "Radeon", NVidia verwendet den Namen "GeForce". Die folgende Tabelle enthält alle aktuell auf dem Markt erhältlichen Gaming-Grafikprozessoren nach Leistung bzw. Marktsegment (grün = Mittelklasse, rot = Oberklasse/High-End, grau = Produktion eingestellt) geordnet.

<
schlechter
Leistung
besser
>









GeForce 20 Super





RTX 2060SRTX 2070SRTX 2080S
GeForce 20
RTX 2060RTX 2070RTX 2080RTX 2080 Ti
GeForce 16
GTX 1650GTX 1650SGTX 1660GTX 1660SGTX 1660 Ti



GeForce 10
GTX 1050 TiGTX 1060 3GGTX 1060 6GGTX 1070GTX 1070 TiGTX 1080GTX 1080 Ti




















Radeon RX 500/Vega
RX 560RX 570RX 580RX 590Vega 56Vega 64Radeon VII

Radeon RX 5000





RX 5700RX 5700 XT

NVidia-GPUs
GeForce-RTX-20-Serie

Die Veröffentlichung der jüngsten Generation von Grafikprozessoren, die nach dem britischen Mathematiker Alan Turing auch als Turing-Generation bezeichnet wird, erfolgte Mitte September 2018. NVidia hat wie bereits bei den vorherigen Generationen zuerst die leistungsfähigsten Modelle auf den Markt gebracht: Die GeForce RTX 2080 Ti, die GeForce RTX 2080 sowie die etwas preisgünstigere GeForce RTX 2070. Am 15. Januar 2019 wurde die Serie durch die GeForce RTX 2060, dem kleinsten Modell, vervollständigt. Bereits ein halbes Jahr später wurde sie zusammen mit der GeForce RTX 2070 und der RTX 2080 durch schnellere Super-Varianten ersetzt, um der Konkurrenz durch die gleichzeitig erschienen Navi-GPUs von AMD Paroli bieten zu können.Der wohl bedeutendste Unterschied zu den Vorgängermodellen der 10er-Serie liegt darin, dass die Grafikchips neben einer größen Anzahl an universellen CUDA-Einheiten (maximal 4352 statt 3548) nun auch spezialisierte Recheneinheiten jeweils für Deep Learning Anti-Aliasing und Raytracing enthalten. Als Grafikspeicher wird außerdem der schnellere GDDR6-Speicher mit einer theoretischen Datentransferrate von 14 Gigatransfers pro Sekunde (GT/s) eingesetzt. Nur die GeForce RTX 2080 Super nutzt Speicher mit einer etwas höheren Geschwindigkeit von 15,5 GT/s.
  

Deep Learning Anti-Aliasing (DLAA)

Deep Learning ist eine fortgeschrittene Form des maschinellen Lernens, bei der künstliche neuronale Netze mit mehreren Abstraktionsschichten oder -ebenen, auch Deep Neural Network (DNN) genannt, zum Einsatz kommen. Dabei wird ein zu lösendes Problem schrittweise in einfachere Teilkonzepte aufgeteilt. Auf diese Weise können nach einem längeren Lernprozess, bei dem sehr viele Eingabewerte gesammelt und ausgewertet werden, etwa Objekte klassifiziert oder bestimmte Muster erkannt werden. Beim DLAA oder DLSS (Deep Learning Super Sampling) wird ein tiefes neuronales Netz dazu verwendet, die Qualität der Kantenglättung zu verbessern. Es wertet kontinuierlich die Bilddaten aus und versucht, Übereinstimmungen mit einem Referenzbild, das einer 64-fachen Kantenglättung unterzogen wurde, zu finden. Dadurch "lernt" das DNN den Algorithmus für das optimale Bild. Dieser Prozess wird auf einem Supercomputer durchgeführt. Der KI-Algorithmus wird dann von den Tensor-Recheneinheiten in der GPU verwendet, um die Katenglättung durchzuführen. DLAA soll eine vergleichbare Bildqualität wie das TAA-Verfahren mit wesentlich geringeren Leistungseinbußen liefern. Allerdings funktioniert die Technik nur in Verbindung mit aktiviertem Raytracing.

Raytracing


Die neuen GPUs unterstützen sogenanntes Hybrid-Rendering, d.h.. bei der Bilddarstellung kann zusätzlich zur bislang üblichen Rasterung auch Raytracing eingesetzt werden. Da die Leistung für die Darstellung einer kompletten Szene via Raytracing nicht ausreicht, soll es nur für Effekte eingesetzt werden, die mit den gebräuchlichen Algorithmen nicht realistisch dargestellt werden können, z.B.globale Beleuchtung oder Reflexionen. Neben der entsprechenden GPU wird dafür auch Windows 10 Version 1809 (oder höher) benötigt. [Quelle]
Seit dem 11. April kann Raytracing ohne hardwareseitige Unterstützung sowohl mit der älteren GeForce-10- als auch mit der GeForce-16-Serie verwendet werden. Vorausgesetzt werden eine Speicherausstattung von mindestens 6 GB sowie die Version 425.31 (oder höher) der NVidia-Treibersoftware.

Weitere Verbesserungen

  • Der von allen Kernen (NVidia bezeichnet diese als Shader-Multiprozessoren) gemeinsam genutzte Pufferspeicher (L2-Cache) ist jeweils doppelt so groß wie beim entsprechenden Vorgängermodell;.

  • Variable Rate Shading: Normalerweise wird für jeden einzelnen Bildpunkt ein eigenes Shader-Programm ausgeführt, das dessen endgültigen Farbwert berechnet. Bei der als Variable Rate Shading bezeichneten Technik können mehrere Bildpunkte zu Blöcken unterschiedlicher Größe zusammengefasst werden. Auf diese Weise kann bei größeren, homogenen Flächen, die sich kaum verändern, Rechenzeit gespart werden.

  • Auch Grafikprozessoren können Rechenoperationen sowohl mit Fließkommazahlen (Floating Point, FP) als auch mit ganzen Zahlen (Integer, INT) durchführen. Bislang konnten die Recheneinheiten (ALUs) entweder einen FP- oder INT-Befehl pro Arbeitstakt ausführen. Jetzt ist es möglich, beide Typen von Instruktionen parallel zu verarbeiten.

  • Der neue 12-nm-Fertigungsprozess führt zu einer erhöhten Energieffizienz im Vergleich zum 16-nm-Fertigungsverfahren der 10er-Serie.

Leistung

  • ohne aktiviertes Raytracing

Im Vergleich zu ihren Vorgängern können die neuen GPUs vor allem in der Ultra-HD-Auflösung einen deutlichen Leistungszuwachs verbuchen. In der weit verbreiteten Full-HD-Auflösung fällt die Mehrleistung eher gering aus (Ausnahme: GeForce RTX 2060). Aufgrund des extrem hohen Preises der neuen GPUs lohnt sich die Anschaffung nur für Technik-Freaks oder absolute Spiele-Enthusiasten, die bereits einen großen UHD-Monitor  besitzen. Wer allerdings auf Ultra-HD verzichten kann und nur eine GeForce GTX 1060 besitzt, für den empfiehlt sich der Kauf einer GeForce RTX 2060, da sie trotz des relativ günstigen Preises bei manchen Spielen sogar das Leistungsniveau einer GeForce GTX 1080 (Founders Edition) erreicht (Quelle). Ob und in welchem Umfang die neuen Fähigkeiten DLSS und Raytracing von den Spieleentwicklern tatsächlich genutzt werden, ist zudem noch nicht abzusehen.
Auflösung
Full HD (1920 x 1080)
Ultra HD (3840 x 2160)
Benchmark
3DMark Fire Strike (Gesamt)
GTA V
Metro: Last Light Redux
3DMark Fire Strike (Gesamt)
GTA V
Metro: Last Light Redux
GeForce RTX 2080 Ti22.767149 fps148,3 fps8.132104,5 fps92,9 fps
GeForce GTX 1080 Ti20.888162,4 fps164,2 fps7.00180,1 fps75 fps
Leistungsgewinn
8%-8,3%-9,7 %16,2%30,5%23,9%
GeForce RTX 208020.198148,2 fps147,1 fps6.55276,2 fps72,6 fps
GeForce GTX 108017.713145,9 fps139,6 fps5.27658 fps57,3 fps
Leistungsgewinn
14%1,6%-5,4%24,2%31,4%26,8%
GeForce RTX 207018.652145,9 fps145,5 fps5.74766,5 fps63 fps
GeForce GTX 107016.510147,6 fps137,4 fps4.78951,7 fps51,1 fps
Leistungsgewinn
13%-1,2%6%20%29%23,3%
GeForce RTX 206016.171145,3134,34.40954,149,3
GeForce GTX 106011.144105,792,43.01839,232,3
Leistungsgewinn
45,1%
37,5%
45,3%
46,1%
38%
52,6%        
Quelle: https://www.chip.de/bestenlisten/Bestenliste-Grafikkarten-PCIe--index/detail/id/733/ (Stand: 31.01.2019, jeweils schnellstes Modell)

  • mit aktiviertem Raytracing

Wer realistische Reflexionen in Scheiben oder Pfützen bewundern möchte, der muss zur Zeit noch starke Leistungseinbußen in Kauf nehmen. Bei Battlefield V, dem bislang einzigen Titel mit Raytracing-Reflexionen, sinkt die Anzahl der berechneten Bilder pro Sekunde im Full-HD-Modus um etwa 40%. Sie befindet sich aber erfreulicherweise immer noch im spielbaren Bereich, was man im Ultra-HD-Modus nicht mehr behaupten kann. Wenn Raytracing hingegen für globale Beleuchtung (z.B. Sonnenlicht) wie in Metro: Exodus eingesetzt wird, sinkt die Leistung nur um etwa 20%, im Ultra-HD-Modus um ein Drittel. Auch die dritte Raytracing-Variante, die bei Shadow of the Tomb Raider zur Darstellung von Schatten genutzt wird, führt im Schnitt zu einer um 28% verringerten Bildrate. Vor allem die schwächste GPU mit Raytracing, die GeForce RTX 2060 stößt bereits im Full-HD-Modus deutlich an ihre Leistungsgrenze. Wenn man sich keine GeForce RTX 2080 Ti leisten kann, sollte man Raytracing auf UHD lieber deaktivieren. Mit Sicherheit werden kommende Aktualisierungen aber noch Leistungsverbesserungen bringen.

  • mit aktiviertem Raytracing und DLSS

Wenn zur Kantenglättung DLSS verwendet wird, können die durch Raytracing verursachten Leistungseinbrühe zumindest teilweise kompensiert werden. Die Bildraten legen vor allem im Ultra-HD-Modus deutlich zu, wodurch auch bei einer GeForce RTX 2070 noch Werte im spielbaren Bereich (30 bis 60 Bilder pro Sekunde) erzielt werden können. Allerdings wirkt sich DLSS je nach Spiel sehr unterschiedlich auf die Bildqualität aus: Entweder wird das Bild unscharf oder die Darstellung wird zwar schärfer und detaillierter, feine Strukturen aber beginnen zu flimmern.

Technische Daten

Die folgende Tabelle listet die technischen Daten der Referenzmodelle (Founders Edition) auf. Modelle anderer Hersteller haben meist eine höhere Taktfrequenz.

GeForce-16-Serie

Um die nach dem Auslaufen der GeForce-10-Serie entstandene Lücke im Mittelklasse-Segment zu schließen, hat NVidia die GeForce-16-Serie veröffentlicht. Sie beruht wie die GeForce-20-Serie auf der Turing-Architektur, verfügt aber nicht über die für Raytracing und Deep Learning Super-Sampling benötigten Recheneinheiten. Eingeführt wurde die neue Serie im Februar 2019 mit der GeForce GTX 1660 Ti, die etwa das Leistungsniveau einer GeForce GTX 1070 erreicht. Die GeForce 1650, das langsamste, aber auch preisgünstigste Modell, wurde als Letztes vorgestellt. Um vor allem den kommenden Radeon-RX-5500-GPUs Paroli bieten zu können, wurden im Oktober und November die S(uper)-Modelle eingeführt, die einen schnelleren Grafikspeicher besitzen.
GeForce-10-Serie

Die 2016 erstmals vorgestellten Grafikprozessoren der Pascal-Generation bot NVidia unter der Bezeichnung GeForce-10-Serie an. Sie umfasste neben den Mittelklassemodellen GeForce GTX 1050 (Ti) und GTX 1060 auch die Oberklasse-Modelle GeForce GTX 1070 (Ti) und GTX 1080 (Ti). Auch nach dem Erscheinen der GeForce RTX 2080 Ti gehört das alte Spitzenmodell noch immer zu den schnellsten GPUs. Die GeForce GTX 1080 Ti war weitaus günstiger zu haben als das entsprechende Nachfolgemodell und erzielte im Full-HD-Modus (1920 x 1080) sogar etwas bessere Leistungswerte.


AMD-GPUs
Radeon-RX-5000-Serie

  
Zusammen mit den Prozessoren der Ryzen-3000-Serie kamen am 7. Juli auch die ersten Grafikkarten mit den neuen Grafikprozessoren der Navi-Generation auf den Markt: Die Radeon 5700 und die Radeon 5700 XT. Die wichtigsten Neuerungen bzw. Unterschiede im Vergleich zum Vorgänger „Radeon Vega“:

RDNA ersetzt GCN (Graphics Core Next)

Erstmals seit 2012 hat AMD den internen Aufbau seiner GPUs überarbeitet und bezeichnet das neue Chipdesign als Radeon-DNA-Architektur (RDNA). RDNA ist noch besser an den spezifischen Programmcode von Spielen angepasst und erhöht so die Anzahl der pro Arbeitstakt ausgeführten Befehle (IPC, Instructions per cycle). Der wichtigste Unterschied zur GCN-Architektur liegt in der Art und Weise, wie die Befehle abgearbeitet werden.

  
  • Mehrere Befehle werden wie bei jeder modernen GPU vor der Ausführung in Gruppen (AMD bezeichnet sie als „Wavefronts“) eingeteilt. Während bei GCN diese kleinste Ausführungseinheit noch 64 Befehle umfasste, kann sie bei RDNA auch nur aus 32 Instruktionen bestehen. Die feinere Einteilung führt zu einer besseren Auslastung der Ausführungseinheiten  
  • Die neue Architektur verfügt über breitere SIMD-Recheneinheiten, die doppelt so viele Befehle gleichzeitig ausführen können (32 statt 16). Auf die Weise wird die Ausführungszeit für eine Wavefront von vier auf zwei Taktzyklen verringert.

Neuer L1-Cache verringert Zugriffszeiten

Zusätzlich wurde auch das Cache-Konzept überarbeitet: Zwischen den beiden bereits vorhandenen Cache-Ebenen wurde eine weitere Hierarchieebene eingeführt Der bisherige L1-Cache rückt dadurch auf die oberste Ebene L0. Durch den neuen L1-Cache sinkt die Zugriffszeit, da insgesamt weniger Zugriffe auf den langsameren L2-Cache notwendig sind.  


GDDR6-Grafikspeicher

Statt teurem HBM2-Speicher (High Bandwidth Memory Generation 2) wird nun wie bei der Konkurrenz der etwas langsamere, aber dafür günstigere GDDR6-Speicher verwendet. Außerdem lassen sich die Speicherchips leichter, kühlen, da sie sich nicht direkt neben der GPU befinden müssen Der Grafikspeicher ist über eine 256 Bit breite Schnittstelle mit dem Grafikchip verbunden und hat eine Übertragungsrate von 14 Gigatransfers pro Sekunde (GT/s).

7-nm-Fertigungsprozess

Kleinere Strukturen sorgen dafür, dass die neuen GPUs eine höhere Leistung bei gleichzeitig geringerem Stromverbrauch bieten. Erste Tests zeigten bereits, dass die neuen Grafikchips viel energieeffizienter als ihre Vorgänger arbeiten.

PCI-Express-4.0-Schnittstelle

Verdoppelt die theoretisch  erzielbare Datenübertragungsrate zwischen GPU und Arbeitsspeicher von ca. 16 GB/s auf 32 GB/s. Voraussetzung dafür ist ein Mainboard mit X570-Chipsatz und ein Ryzen-3000-Prozessor.


Modellübersicht

Die folgende Tabelle listet die wichtigsten technischen Spezifikationen der Referenzmodelle von AMD auf. Basis- und Turbotakt sind bei Grafikkarten, die von anderen Herstellern produziert werden, in der Regel höher angesetzt.
  
Leistung

Leistungsmäßig platzieren sich die beiden neuen GPUs von AMD knapp oberhalb einer entsprechenden GeForce GTX 2070 bzw. einer GeForce GTX 2060. Gegenüber der etwa gleichzeitig erschienenen Super-Variante der beiden Konkurrenzmodelle ziehen sie allerdings klar den Kürzeren. Effizienter als ihr Vorgänger rechnen die neuen Grafikprozessoren auf jeden Fall: Die Radeon RX 5700 mit nur 2.304 Recheneinheiten erreicht etwa das gleiche Leistungsniveau wie eine Radeon RX Vega 64 mit 4.096 Recheneinheiten. Zum Zeitpunkt der Tests befanden sich die Treiber allerdings noch im Beta-Zustand.

Radeon VII

Anfang Februar hat AMD die Radeon VII auf den Markt gebracht. Es handelt sich dabei um den ersten und wohl einzigen Ableger der eigentlich für den professionellen Bereich (z.B. CAD) entwickelten Vega-20-GPU. Mit dem Erscheinen der Radeon-RX-5000-Serie am 7. Juli wurde die Produktion eingestellt. AMD wollte mit der Radeon VII kurzfristig die entstandene Leistungslücke zwischen der RX-Vega- (Vega 10) und der GeForce-20-Serie des Konkurrenten NVidia verkleinern. Die Unterschiede werden in der folgenden Tabelle kurz zusammengefasst:
GPU
Struktur- breite
Chiptakt (Normal/Turbo)
SPs/TMUs/ROPs
Grafikspeicher (Größe/Typ)
Anbindung (Breite/ Durchsatz)
GeForce RTX 2080
12 nm1515/1800 MHz2944/184/648 GiB GDDR6256 Bit/448 GB/s
Radeon VII7 nm1400/1750 MHz3840/240/6416 GiB HBM24096 Bit/1024 GB/s
Die beiden herausragenden Merkmale der Radeon VII, die sie auch für PC-Spieler interessant macht, sind der extrem große und schnelle Speicher (HBM = High Bandwidth Memory, Speicher mit hoher Bandbreite) sowie das verbesserte Fertigungsverfahren mit einer Breite der kleinsten fertigbaren Struktur von nur noch 7 Nanometern (1 Nm entspr. einem Millardstel Meter).

16 GiB HBM2-Grafikspeicher

Der größte Trumpf der GPU gegenüber der Konkurrenz und auch des Vorgängers sind der mit 16 GiB im Vergleich doppelt so große Grafikspeicher. Selbst NVidias Spitzenmodell, die GeForce RTX 2080 Ti, verfügt nur über 11 GiB. Die Datenübertragung zwischen GPU und Grafikspeicher erfolgt über 4.096 Leitungen. Dadurch ergibt sich ein wesentlich höherer Durchsatz als bei einer GeForce RTX 2080 mit nur 256 Leitungen. In den Leistungstests macht sich der größere und schnellere Speicher vor allem bei höheren Auflösungen bemerkbar.

7-nm-Fertigungsverfahren

Das neue Fertigungsverfahren ermöglicht es, mehr Funktionseinheiten auf einer kleineren Chipfläche unterzubringen und die entstehende Verlustwärme zu verringern. Außerdem konnte dadurch die Taktfrequenz im Vergleich zum Vorgänger um 10 bzw. 13 % (maximal erreichbare Taktfrequenz im Turbomodus) erhöht werden -  bei gleichzeitig niedrigerem Stromverbrauch. Dennoch ist die GeForce RTX 2080 noch sparsamer und effizienter.

Leistung

Wenn man das Gesamtbild betrachtet, liegt die Radeon VII leistungsmäßig zwischen einer GeForce GTX 1070 und einer GeForce RTX 2080. Im Vergleich zum Vorgängermodell, der RX-Vega-64-GPU ist sie durchschnittlich um 25 % schneller. Allerdings kann sie ihre volle Leistung erst in höheren Auflösungen voll entfalten und kommt dort nah an das direkte Konkurrenzmodell heran. Auch wenn die neue GPU von AMD bei 4K-Inhalten (Ultra-HD, 3840x2160) und hier besonders bei professionellen Anwendungen im Bereich Bild-/Videobearbeitung zweifellos zur Oberklasse gehört, ist sie aufgrund ihres (noch) höheren Preises nur bedingt empfehlenswert. Darüber hinaus wird in vielen Tests moniert, dass die drei Axiallüfter des Referenzmodells extrem laut seien. Dieses Problem kann aber hoffentlich zeitnah durch eine softwareseitige Optimierung der Lüftersteuerung behoben werden.

Quellen:


Radeon RX-500- und RX-Vega-Serie

AMD bietet seine Grafikprozessoren im Mittelklasse-Segment als Radeon-RX-500-Serie an. Dabei handelt es sich um eine Neuauflage der RX-400-Serie mit leicht erhöhtem Referenztakt. Das Angebot reicht vom eher langsamen Einsteigermodell RX 550 bis hin zum RX 590, das leistungsmäßig etwas über einer NVidia GeForce GTX 1060 liegt. Daneben hat AMD mit der Vega-Serie auch zwei Oberklasse-Modelle für leidenschaftliche Spieler im Sortiment.
Zurück zum Seiteninhalt