Logo von heise online

Suche
Andreas Stiller 83

Supercomputer: Asien überholt Europa

Mit zwei Besonderheiten wartet diesmal die neue Top500-Liste der Supercomputer auf, die zu Beginn der in Seattle stattfindenden Supercomputer-Konferenz 2011 bekannt gegeben wurde. Erstmals ist die Reihenfolge der obersten zehn Systeme gegenüber der vorigen Liste, veröffentlicht im Juni 2011, unverändert geblieben. Und erstmals ist auch ein System dabei, dessen Prozessorarchitektur nicht aus US-amerikanischer oder japanischer Entwicklung stammt.

Anzeige

Mit 10 PFlops ist der japanische K Computer, der aus 800 solcher Racks mit je 24 Boards besteht, weiterhin Spitzenreiter under den Supercomputern
Mit 10 PFlops ist der japanische K Computer, der aus 800 solcher Racks mit je 24 Boards besteht, weiterhin Spitzenreiter. Vergrößern
Bild: RIKEN
Dass der japanische K Computer an der Spitze noch nicht geschlagen werden konnte, war wenig überraschend. Zu groß war sein Vorsprung mit insgesamt 8,16 PFlops, die er schon im Teilausbau im Juni vorlegen konnte. Nun hat er seine finale Größe und auch seine finale Zielleistung erreicht und über 10 PFlops im Linpack erzielt. Platz 2 hält weiterhin der chinesische Tianghe 1A – der seine Performance von 2,57 PFlops vor allem aus Nvidia-2050-GPUs speist – vor dem Cray-XT-System "Jaguar" des Oak Ridge National Laboratory, dessen Opteron-Prozessoren 1,76 PFlops erreichten.

Bei dem ersten Fremdprozessor in der zwanzigjährigen amerikanisch-japanischen Hegemonie der Top500 handelt es um einen Prozessor aus China – aber nicht um den seit Langem erwarteten Loongson 3, sondern um einen Prozessor namens ShenWei SW1600. Über dessen Architektur weiß man nicht viel, man vermutet, dass hier der Alpha-Prozessor von DEC Pate gestanden hat. Sein Instruktionssatz soll wie beim Longsoon auf MIPS beruhen. Er hat 16 Kerne pro Chip, läuft mit 945 MHz und schafft in seinen beiden FPUs 8 Gleitkommaoperationen pro Takt. Damit kommt das System Sunway Bluelight MPP mit 137.200 Kernen auf 796 TFlops und erreicht Platz 14 der Liste.


Deutschland schnellster Rechner steht jetzt in Stuttgart am HLRS Vergrößern
Bild: HLRS
Einen neuen Spitzenreiter gibt es derweil in Deutschland. Das Hochleistungsrechenzentrum in Stuttgart konnte sich mit Hermit, einem Cray-XE6-System mit dem nagelneuen AMD-Prozessor Opteron 6276 (Interlagos) mit Bulldozerarchitektur, mit 831 Tflops knapp vor dem lange Zeit führenden JuGene-Rechner (826 Tflops) in Jülich setzen. Für beide reichte es für die Top 10 nicht ganz, Hermit belegt Platz 12 und JuGene Platz 13.

AMD hat allerdings ein bisschen gegenüber der letzten Liste verloren, von 66 auf 63 platzierte Systeme. Die am heutigen Montag offiziell vorgestellte Opteron-6200-Familie kam offenbar etwas zu spät, um hier schon in größerem Umfang eingreifen zu können. Sieben Systeme sind aber damit bereits bestückt, fünf davon allein in Europa. Auch zwei kleinere Cray -XK6-Systeme in Polen und der Schweiz sind darunter, die zusätzlich Nvidia-GPUs (Tesla 2050 oder 2090) auf dem Board haben. Intel hält nahezu seinen Anteil von 77 Prozent mit 384 Systemen (von 386 zuvor). Und IBM Power konnte wieder ein wenig von 45 auf 49 Systeme zulegen.

IBM hat auch bei der Gesamtzahl der Systeme ein wenig von 218 auf 223 draufgelegt und HP verloren (140, zuvor 146). Dahinter folgen Cray, SGI, Bull und Appro. Schaut man sich jedoch nur die Top 50 an, so dominiert hier ganz klar Cray mit 14 Supercomputern, doppelt so viel wie IBM. HP brachte gerade einmal ein System in diesen Spitzenbereich – und das auch nur deshalb, weil HP die beiden mobilen Container-Systeme von Airbus in Hamburg und Toulouse einmal zum Linpack-Lauf zusammengeschaltet hatte.

Die USA bauten ihre Dominanz weiter von 255 auf nunmehr 262 Systeme aus. Europa fiel von 126 auf 103 Systeme zurück und wurde von Asien überholt, das von 103 auf 119 Systeme zulegte.

In Europa sind Großbritannien, Frankreich und Deutschland mit 27, 23 und 20 Systemen relativ nah beieinander, wobei ausgedrückt in aggregierter Rechenleistung Frankreich mit 3,72 PFlops ganz knapp vor Deutschland mit 3,63 PFlops die Nase vorn hat. Großbritannien folgt mit 2,77 PFlops.

Anzeige

Über doppelt so viele Supercomputer wie in der letzten Liste sind per GPU beschleunigt: 39 gegenüber 17. Nvidia dominiert hier mit 35 Systemen klar; AMD/ATI und IBM-PowerXCell sind in jeweils 2 Systemen zu finden.

Die Gesamtleistung der 500 verzeichneten Supercomputer nahm um 26 Prozent auf 74,2 PFlops zu, inzwischen braucht man 51,2 TFlops, um überhaupt noch in die Liste zu kommen.

Top 10 der 38. Top500-Liste der Supercomputer
Platz (vor. Liste) Rechner (Hersteller) Betreiber Land Prozessoren (Cores) Rmax (TFlops) Energie-verbrauch [MW]
1 (1) K Computer (Fujitsu) RIKEN Advanced Institute for Computational Science (AICS) Japan 705.024 8C-SPARC64 VIIIfx, 2 GHz 10500 12,7
2 (2) Tianhe-1A (NUDT) National SuperComputer Center Tianjin China 86.016 6C-Xeon 2,93GHz +7168*14 Nvidia Tesla M2050 2566 4,04
3 (3) Jaguar (Cray XT5) Oak Ridge National Lab USA 224.162 6C-Opteron, 2,6 GHz 1759 6,95
4 (4) Nebulae (Dawning) National SuperComputer Center Shenzhen China 55.680 6C-Xeon 5650 2,66 GHz + 4640*14 Nvidia Tesla C2050 (1,15 GHz) 1271 2,58
5 (5) Tsubame 2 (NEC/HP) Tokyo Inst. Of Technology Japan 16.896 6C Xeon-Westmere 2,93 GHz + 4224*14 Nvidia M2050 1192 1,4
6 (6) Cielo (Cray) DOE/NNSA/LANL/SNL USA 142.272 8C-Opteron, 2,4 GHz 1111 3,98
7 (7) Pleiades (SGI) NASA/Ames REserach Center/NAS USA 111.104 4/6-C Xeon 2,93 GHz 1088 4,1
8 (8) Hopper (Cray XE6) DOE/SC/LBNL/NERSC USA 153.408 12C Opteron 2,1 GHz 1054 2,91
9 (9) Tera 100 (Bull) CEA Frank. 138.368 Nehalem-EX 2,26 GHz 1050 4,59
10 (10) Roadrunner (IBM) DOE/NNSA/LANL USA 122.440 (SPE:3,2 GHz +PPC:3,2 GHz+DC-Opteron:1,8GHz) 1042 2,35
(as)

83 Kommentare

Themen:

Anzeige
  1. Supercomputer: Deutschland dreht auf, China schwächelt

    SuperMUC Phase 2

    Die auf ISC'15 in Frankfurt am Main vorgestellte neu TOP500-Liste der Supercomputer zeigt an der Spitze zwar kaum Veränderungen, aber dahinter gab es interessante Verschiebungen.

  2. Supercomputer: China schickt die "Terrakotta"-Armee

    Supercomputer: China schickt die "Terakotta"-Armee

    Die neue Top500-LIste der Supercomputer hat wenig Änderungen an der Spitze, aber viele im Mittelfeld. Vor allem China legt ordentlich zu.

  3. Supercomputer: China überholt die USA

    Supercomputer: China überholt die USA

    Die HPC-Konferenz ISC startet gleich mit einem Knaller: China hat jetzt nicht nur die beiden schnellsten Supercomputer in der Top500-Liste, die Peta- und "Tera"-kotta-Armeen sind auch in Truppenstärke und in der Gesamtperformance überlegen.

  4. Intel bringt (endlich) den HPC-Prozessor Xeon Phi Knights Landing

    Intel bringt (endlich) den Xeon Phi Knights Landing

    Intels HPC-Chef Raj Hazra nutzte den ersten Tag der ISC in Frankfurt am Main, um dort den neuen Supercomputer-Prozessor Xeon Phi Knights Landing feierlich vom Stapel laufen zu lassen.

  1. Größere Datenmengen mit JavaScript performant durchsuchen

    Mit AngularJS lassen sich Suchen mit Filtern realisieren (Abb. 1).

    Die Suche nach Textdaten ist eine Kernfunktion vieler Anwendungen. Um sie genau, schnell und fehlertolerant zu gestalten, kommen häufig Suchserver zum Einsatz – es gibt aber auch andere Herangehensweisen.

  2. Internet-Protokolle, Teil 2: Anwendungsprotokolle im Vergleich

    Das ISO/OSI-Schichtenmodell gliedert Protokollfunktionen im Gegensatz zum TCP/IP-Modell feiner auf (Abb. 1).

    Bevor man ein eigenes Protokoll entwickelt, lohnt es sich häufig, erst einmal zu prüfen, was bestehende bereits leisten. Sei es, um Inspiration und Verständnis zu erlangen, sei es, um zu erkennen, dass man sich die Arbeit sparen kann.

  3. Benchmarking Spark: Wie sich unterschiedliche Hardware-Parameter auf Big-Data-Anwendungen auswirken

    Ansicht des HDFS-Dateisystems auf der EC2-Cluster von Spark (Abb. 1)

    Dank leistungsfähiger Hadoop-Distributionen ist es einfach geworden, ein komplettes Hadoop/Spark-Cluster in der Cloud zu installieren. Schwieriger wird es jedoch, die optimale Konfiguration der virtualisierten Cloud-Hardware für den jeweiligen Anwendungsfall zu finden, denn unterschiedliche Hardwarekonfigurationen können sich sehr wohl auf das Verhalten von Spark-Anwendungen im Cluster-Betrieb auswirken.

  1. Fiat Tipo 1.6 E-torQ im Test

    Test: Fiat Tipo

    Der neue Fiat Tipo ist einer der preiswertesten Vertreter seiner Klasse. Im Test zeigte sich, dass jene Käufer, die bei Motor und Ausstattung nah an der Basis bleiben, auf einem guten Weg zum besten Tipo sind

  2. EU-Kommission: Apple erhielt illegale Subventionen in Irland

    Apple

    Der Milliarden-Steuerstreit zwischen Brüssel, Irland und dem iPhone-Hersteller spitzt sich zu: Offenbar glaubt die EU-Kommission, dass das Steuersparmodell des Konzerns auf der grünen Insel nicht rechtens ist. Es drohen hohe Nachzahlungen.

  3. "iPhone 7", "Apple Watch 2": Apple zeigt am 7. September Neues

    Apple kündigt Veranstaltung für 7. September an

    Mit bunten Kringeln auf dunklem Hintergrund und der wie üblich vieldeutigen Überschrift "See you on the 7th" lädt Apple ausgewählte Pressevertreter zu einer Veranstaltung ein.

  4. Telepräsenz: Blinzelnden Robotern fehlt der richtige Riecher

    RO-MAN 2016: Blinzelnden Robotern fehlt der richtige Riecher

    Menschen blinzeln pro Minute ca. 17 Mal. Blinzelt während einer Interaktion auch ein Roboter, könnte dies die Kommunikation verbessern. In der Telemedizin ist indes ein menschlicher Assistenz wichtig. Er kann z.B. riechen, ob Patienten alkoholisiert sind.

Anzeige