Logo von c't

Suche
83

Supercomputer: Asien überholt Europa

Mit zwei Besonderheiten wartet diesmal die neue Top500-Liste der Supercomputer auf, die zu Beginn der in Seattle stattfindenden Supercomputer-Konferenz 2011 bekannt gegeben wurde. Erstmals ist die Reihenfolge der obersten zehn Systeme gegenüber der vorigen Liste, veröffentlicht im Juni 2011, unverändert geblieben. Und erstmals ist auch ein System dabei, dessen Prozessorarchitektur nicht aus US-amerikanischer oder japanischer Entwicklung stammt.

Anzeige

Mit 10 PFlops ist der japanische K Computer, der aus 800 solcher Racks mit je 24 Boards besteht, weiterhin Spitzenreiter under den Supercomputern
Mit 10 PFlops ist der japanische K Computer, der aus 800 solcher Racks mit je 24 Boards besteht, weiterhin Spitzenreiter. Vergrößern
Bild: RIKEN
Dass der japanische K Computer an der Spitze noch nicht geschlagen werden konnte, war wenig überraschend. Zu groß war sein Vorsprung mit insgesamt 8,16 PFlops, die er schon im Teilausbau im Juni vorlegen konnte. Nun hat er seine finale Größe und auch seine finale Zielleistung erreicht und über 10 PFlops im Linpack erzielt. Platz 2 hält weiterhin der chinesische Tianghe 1A – der seine Performance von 2,57 PFlops vor allem aus Nvidia-2050-GPUs speist – vor dem Cray-XT-System "Jaguar" des Oak Ridge National Laboratory, dessen Opteron-Prozessoren 1,76 PFlops erreichten.

Bei dem ersten Fremdprozessor in der zwanzigjährigen amerikanisch-japanischen Hegemonie der Top500 handelt es um einen Prozessor aus China – aber nicht um den seit Langem erwarteten Loongson 3, sondern um einen Prozessor namens ShenWei SW1600. Über dessen Architektur weiß man nicht viel, man vermutet, dass hier der Alpha-Prozessor von DEC Pate gestanden hat. Sein Instruktionssatz soll wie beim Longsoon auf MIPS beruhen. Er hat 16 Kerne pro Chip, läuft mit 945 MHz und schafft in seinen beiden FPUs 8 Gleitkommaoperationen pro Takt. Damit kommt das System Sunway Bluelight MPP mit 137.200 Kernen auf 796 TFlops und erreicht Platz 14 der Liste.


Deutschland schnellster Rechner steht jetzt in Stuttgart am HLRS Vergrößern
Bild: HLRS
Einen neuen Spitzenreiter gibt es derweil in Deutschland. Das Hochleistungsrechenzentrum in Stuttgart konnte sich mit Hermit, einem Cray-XE6-System mit dem nagelneuen AMD-Prozessor Opteron 6276 (Interlagos) mit Bulldozerarchitektur, mit 831 Tflops knapp vor dem lange Zeit führenden JuGene-Rechner (826 Tflops) in Jülich setzen. Für beide reichte es für die Top 10 nicht ganz, Hermit belegt Platz 12 und JuGene Platz 13.

AMD hat allerdings ein bisschen gegenüber der letzten Liste verloren, von 66 auf 63 platzierte Systeme. Die am heutigen Montag offiziell vorgestellte Opteron-6200-Familie kam offenbar etwas zu spät, um hier schon in größerem Umfang eingreifen zu können. Sieben Systeme sind aber damit bereits bestückt, fünf davon allein in Europa. Auch zwei kleinere Cray -XK6-Systeme in Polen und der Schweiz sind darunter, die zusätzlich Nvidia-GPUs (Tesla 2050 oder 2090) auf dem Board haben. Intel hält nahezu seinen Anteil von 77 Prozent mit 384 Systemen (von 386 zuvor). Und IBM Power konnte wieder ein wenig von 45 auf 49 Systeme zulegen.

IBM hat auch bei der Gesamtzahl der Systeme ein wenig von 218 auf 223 draufgelegt und HP verloren (140, zuvor 146). Dahinter folgen Cray, SGI, Bull und Appro. Schaut man sich jedoch nur die Top 50 an, so dominiert hier ganz klar Cray mit 14 Supercomputern, doppelt so viel wie IBM. HP brachte gerade einmal ein System in diesen Spitzenbereich – und das auch nur deshalb, weil HP die beiden mobilen Container-Systeme von Airbus in Hamburg und Toulouse einmal zum Linpack-Lauf zusammengeschaltet hatte.

Die USA bauten ihre Dominanz weiter von 255 auf nunmehr 262 Systeme aus. Europa fiel von 126 auf 103 Systeme zurück und wurde von Asien überholt, das von 103 auf 119 Systeme zulegte.

In Europa sind Großbritannien, Frankreich und Deutschland mit 27, 23 und 20 Systemen relativ nah beieinander, wobei ausgedrückt in aggregierter Rechenleistung Frankreich mit 3,72 PFlops ganz knapp vor Deutschland mit 3,63 PFlops die Nase vorn hat. Großbritannien folgt mit 2,77 PFlops.

Über doppelt so viele Supercomputer wie in der letzten Liste sind per GPU beschleunigt: 39 gegenüber 17. Nvidia dominiert hier mit 35 Systemen klar; AMD/ATI und IBM-PowerXCell sind in jeweils 2 Systemen zu finden.

Die Gesamtleistung der 500 verzeichneten Supercomputer nahm um 26 Prozent auf 74,2 PFlops zu, inzwischen braucht man 51,2 TFlops, um überhaupt noch in die Liste zu kommen.

Top 10 der 38. Top500-Liste der Supercomputer
Platz (vor. Liste) Rechner (Hersteller) Betreiber Land Prozessoren (Cores) Rmax (TFlops) Energie-verbrauch [MW]
1 (1) K Computer (Fujitsu) RIKEN Advanced Institute for Computational Science (AICS) Japan 705.024 8C-SPARC64 VIIIfx, 2 GHz 10500 12,7
2 (2) Tianhe-1A (NUDT) National SuperComputer Center Tianjin China 86.016 6C-Xeon 2,93GHz +7168*14 Nvidia Tesla M2050 2566 4,04
3 (3) Jaguar (Cray XT5) Oak Ridge National Lab USA 224.162 6C-Opteron, 2,6 GHz 1759 6,95
4 (4) Nebulae (Dawning) National SuperComputer Center Shenzhen China 55.680 6C-Xeon 5650 2,66 GHz + 4640*14 Nvidia Tesla C2050 (1,15 GHz) 1271 2,58
5 (5) Tsubame 2 (NEC/HP) Tokyo Inst. Of Technology Japan 16.896 6C Xeon-Westmere 2,93 GHz + 4224*14 Nvidia M2050 1192 1,4
6 (6) Cielo (Cray) DOE/NNSA/LANL/SNL USA 142.272 8C-Opteron, 2,4 GHz 1111 3,98
7 (7) Pleiades (SGI) NASA/Ames REserach Center/NAS USA 111.104 4/6-C Xeon 2,93 GHz 1088 4,1
8 (8) Hopper (Cray XE6) DOE/SC/LBNL/NERSC USA 153.408 12C Opteron 2,1 GHz 1054 2,91
9 (9) Tera 100 (Bull) CEA Frank. 138.368 Nehalem-EX 2,26 GHz 1050 4,59
10 (10) Roadrunner (IBM) DOE/NNSA/LANL USA 122.440 (SPE:3,2 GHz +PPC:3,2 GHz+DC-Opteron:1,8GHz) 1042 2,35
(as)

83 Kommentare