Logo von heise online

Suche
Andreas Stiller 83

Supercomputer: Asien überholt Europa

Mit zwei Besonderheiten wartet diesmal die neue Top500-Liste der Supercomputer auf, die zu Beginn der in Seattle stattfindenden Supercomputer-Konferenz 2011 bekannt gegeben wurde. Erstmals ist die Reihenfolge der obersten zehn Systeme gegenüber der vorigen Liste, veröffentlicht im Juni 2011, unverändert geblieben. Und erstmals ist auch ein System dabei, dessen Prozessorarchitektur nicht aus US-amerikanischer oder japanischer Entwicklung stammt.

Mit 10 PFlops ist der japanische K Computer, der aus 800 solcher Racks mit je 24 Boards besteht, weiterhin Spitzenreiter under den Supercomputern
Mit 10 PFlops ist der japanische K Computer, der aus 800 solcher Racks mit je 24 Boards besteht, weiterhin Spitzenreiter. Vergrößern
Bild: RIKEN
Dass der japanische K Computer an der Spitze noch nicht geschlagen werden konnte, war wenig überraschend. Zu groß war sein Vorsprung mit insgesamt 8,16 PFlops, die er schon im Teilausbau im Juni vorlegen konnte. Nun hat er seine finale Größe und auch seine finale Zielleistung erreicht und über 10 PFlops im Linpack erzielt. Platz 2 hält weiterhin der chinesische Tianghe 1A – der seine Performance von 2,57 PFlops vor allem aus Nvidia-2050-GPUs speist – vor dem Cray-XT-System "Jaguar" des Oak Ridge National Laboratory, dessen Opteron-Prozessoren 1,76 PFlops erreichten.

Bei dem ersten Fremdprozessor in der zwanzigjährigen amerikanisch-japanischen Hegemonie der Top500 handelt es um einen Prozessor aus China – aber nicht um den seit Langem erwarteten Loongson 3, sondern um einen Prozessor namens ShenWei SW1600. Über dessen Architektur weiß man nicht viel, man vermutet, dass hier der Alpha-Prozessor von DEC Pate gestanden hat. Sein Instruktionssatz soll wie beim Longsoon auf MIPS beruhen. Er hat 16 Kerne pro Chip, läuft mit 945 MHz und schafft in seinen beiden FPUs 8 Gleitkommaoperationen pro Takt. Damit kommt das System Sunway Bluelight MPP mit 137.200 Kernen auf 796 TFlops und erreicht Platz 14 der Liste.


Deutschland schnellster Rechner steht jetzt in Stuttgart am HLRS Vergrößern
Bild: HLRS
Einen neuen Spitzenreiter gibt es derweil in Deutschland. Das Hochleistungsrechenzentrum in Stuttgart konnte sich mit Hermit, einem Cray-XE6-System mit dem nagelneuen AMD-Prozessor Opteron 6276 (Interlagos) mit Bulldozerarchitektur, mit 831 Tflops knapp vor dem lange Zeit führenden JuGene-Rechner (826 Tflops) in Jülich setzen. Für beide reichte es für die Top 10 nicht ganz, Hermit belegt Platz 12 und JuGene Platz 13.

AMD hat allerdings ein bisschen gegenüber der letzten Liste verloren, von 66 auf 63 platzierte Systeme. Die am heutigen Montag offiziell vorgestellte Opteron-6200-Familie kam offenbar etwas zu spät, um hier schon in größerem Umfang eingreifen zu können. Sieben Systeme sind aber damit bereits bestückt, fünf davon allein in Europa. Auch zwei kleinere Cray -XK6-Systeme in Polen und der Schweiz sind darunter, die zusätzlich Nvidia-GPUs (Tesla 2050 oder 2090) auf dem Board haben. Intel hält nahezu seinen Anteil von 77 Prozent mit 384 Systemen (von 386 zuvor). Und IBM Power konnte wieder ein wenig von 45 auf 49 Systeme zulegen.

IBM hat auch bei der Gesamtzahl der Systeme ein wenig von 218 auf 223 draufgelegt und HP verloren (140, zuvor 146). Dahinter folgen Cray, SGI, Bull und Appro. Schaut man sich jedoch nur die Top 50 an, so dominiert hier ganz klar Cray mit 14 Supercomputern, doppelt so viel wie IBM. HP brachte gerade einmal ein System in diesen Spitzenbereich – und das auch nur deshalb, weil HP die beiden mobilen Container-Systeme von Airbus in Hamburg und Toulouse einmal zum Linpack-Lauf zusammengeschaltet hatte.

Die USA bauten ihre Dominanz weiter von 255 auf nunmehr 262 Systeme aus. Europa fiel von 126 auf 103 Systeme zurück und wurde von Asien überholt, das von 103 auf 119 Systeme zulegte.

In Europa sind Großbritannien, Frankreich und Deutschland mit 27, 23 und 20 Systemen relativ nah beieinander, wobei ausgedrückt in aggregierter Rechenleistung Frankreich mit 3,72 PFlops ganz knapp vor Deutschland mit 3,63 PFlops die Nase vorn hat. Großbritannien folgt mit 2,77 PFlops.

Über doppelt so viele Supercomputer wie in der letzten Liste sind per GPU beschleunigt: 39 gegenüber 17. Nvidia dominiert hier mit 35 Systemen klar; AMD/ATI und IBM-PowerXCell sind in jeweils 2 Systemen zu finden.

Die Gesamtleistung der 500 verzeichneten Supercomputer nahm um 26 Prozent auf 74,2 PFlops zu, inzwischen braucht man 51,2 TFlops, um überhaupt noch in die Liste zu kommen.

Top 10 der 38. Top500-Liste der Supercomputer
Platz (vor. Liste) Rechner (Hersteller) Betreiber Land Prozessoren (Cores) Rmax (TFlops) Energie-verbrauch [MW]
1 (1) K Computer (Fujitsu) RIKEN Advanced Institute for Computational Science (AICS) Japan 705.024 8C-SPARC64 VIIIfx, 2 GHz 10500 12,7
2 (2) Tianhe-1A (NUDT) National SuperComputer Center Tianjin China 86.016 6C-Xeon 2,93GHz +7168*14 Nvidia Tesla M2050 2566 4,04
3 (3) Jaguar (Cray XT5) Oak Ridge National Lab USA 224.162 6C-Opteron, 2,6 GHz 1759 6,95
4 (4) Nebulae (Dawning) National SuperComputer Center Shenzhen China 55.680 6C-Xeon 5650 2,66 GHz + 4640*14 Nvidia Tesla C2050 (1,15 GHz) 1271 2,58
5 (5) Tsubame 2 (NEC/HP) Tokyo Inst. Of Technology Japan 16.896 6C Xeon-Westmere 2,93 GHz + 4224*14 Nvidia M2050 1192 1,4
6 (6) Cielo (Cray) DOE/NNSA/LANL/SNL USA 142.272 8C-Opteron, 2,4 GHz 1111 3,98
7 (7) Pleiades (SGI) NASA/Ames REserach Center/NAS USA 111.104 4/6-C Xeon 2,93 GHz 1088 4,1
8 (8) Hopper (Cray XE6) DOE/SC/LBNL/NERSC USA 153.408 12C Opteron 2,1 GHz 1054 2,91
9 (9) Tera 100 (Bull) CEA Frank. 138.368 Nehalem-EX 2,26 GHz 1050 4,59
10 (10) Roadrunner (IBM) DOE/NNSA/LANL USA 122.440 (SPE:3,2 GHz +PPC:3,2 GHz+DC-Opteron:1,8GHz) 1042 2,35
(as)

83 Kommentare

Themen:

Anzeige
  1. Supercomputer: Deutschland dreht auf, China schwächelt

    SuperMUC Phase 2

    Die auf ISC'15 in Frankfurt am Main vorgestellte neu TOP500-Liste der Supercomputer zeigt an der Spitze zwar kaum Veränderungen, aber dahinter gab es interessante Verschiebungen.

  2. Supercomputer: China schickt die "Terrakotta"-Armee

    Supercomputer: China schickt die "Terakotta"-Armee

    Die neue Top500-LIste der Supercomputer hat wenig Änderungen an der Spitze, aber viele im Mittelfeld. Vor allem China legt ordentlich zu.

  3. Skylake-Prozessoren mit Iris-Pro-Grafik für Desktop-PCs

    Skylake R

    Intel hat seine Preisliste um drei Core-i-CPUs der sechsten Generation mit leistungfähiger Iris-Pro-GPU und Embedded DRAM erweitert. Letzterer bindet im Prozessor nun an anderer Stelle an.

  4. Intels Server-Prozessor Xeon D-1500: 16-Kern-Version tritt 2016 gegen ARM-SoCs an

    Intel Xeon D-1500: Roadmap

    Bei den Prozessoren für Cloud- und Storage-Server will sich Intel nicht die Butter vom Brot nehmen lassen: 2016 treten neue Xeon-D-Typen gegen ARMv8-SoCs an.

  1. Größere Datenmengen mit JavaScript performant durchsuchen

    Mit AngularJS lassen sich Suchen mit Filtern realisieren (Abb. 1).

    Die Suche nach Textdaten ist eine Kernfunktion vieler Anwendungen. Um sie genau, schnell und fehlertolerant zu gestalten, kommen häufig Suchserver zum Einsatz – es gibt aber auch andere Herangehensweisen.

  2. Internet-Protokolle, Teil 2: Anwendungsprotokolle im Vergleich

    Das ISO/OSI-Schichtenmodell gliedert Protokollfunktionen im Gegensatz zum TCP/IP-Modell feiner auf (Abb. 1).

    Bevor man ein eigenes Protokoll entwickelt, lohnt es sich häufig, erst einmal zu prüfen, was bestehende bereits leisten. Sei es, um Inspiration und Verständnis zu erlangen, sei es, um zu erkennen, dass man sich die Arbeit sparen kann.

  3. Benchmarking Spark: Wie sich unterschiedliche Hardware-Parameter auf Big-Data-Anwendungen auswirken

    Ansicht des HDFS-Dateisystems auf der EC2-Cluster von Spark (Abb. 1)

    Dank leistungsfähiger Hadoop-Distributionen ist es einfach geworden, ein komplettes Hadoop/Spark-Cluster in der Cloud zu installieren. Schwieriger wird es jedoch, die optimale Konfiguration der virtualisierten Cloud-Hardware für den jeweiligen Anwendungsfall zu finden, denn unterschiedliche Hardwarekonfigurationen können sich sehr wohl auf das Verhalten von Spark-Anwendungen im Cluster-Betrieb auswirken.

  1. c't uplink 8.2: Neue Smartphones, Smartwatches und Displays auf der IFA

    c't uplink 8.1

    c't uplink kommt in dieser Woche direkt von der Technikmesse IFA in Berlin. Wir sprechen über die Samsung Gear S2, Smartphones von Gigaset und Huawei und das 4K-Display im Sony Xperia Z5 Premium, das kein 4K zeigt.

  2. Der Aldi-PC November 2015: Medion Akoya P5320 E (MD 8875)

    Aldi-PC Medion Akoya P5320 E (MD 8875)

    Der neueste Aldi-PC mit Skylake-Prozessor gleicht in vielen Details seinem genauso teuren Vorgänger aus dem November 2014, kann aber manches besser: unter anderem dank SSD und Windows 10.

  3. Vor 40 Jahren: Mercedes bringt den ersten 5-Zylinder-Pkw-Diesel

    Endlich ein bisschen Leistung

    Der 240 D 3.0 ist der erste Serien-Pkw mit einem Fünfzylinder-Dieselmotor. Der 80 PS leistende 3,0-Liter macht die landläufig „Strich-Acht“ genannten Modelle der Baureihe W115 zu den schnellsten Diesel-Pkw der Welt

  4. Zahlen, bitte! Nicht vergessen: Mittwoch ist "Geek Pride Day"

    Zahlen, bitte! Nicht vergessen: Morgen ist "Geek Pride Day"

    Wer die Geek- und Nerd-Kultur gebührend feiern will, verlässt am Mittwoch das Haus nicht ohne Handtuch, Lichtschwert (ein Blaster tuts auch) oder Flieder.

Anzeige