Zuhause Vorausdenken Der schnellste Supercomputer der Welt jetzt in China

Der schnellste Supercomputer der Welt jetzt in China

Video: China baut schnellsten Computer der Welt (Kann 2024)

Video: China baut schnellsten Computer der Welt (Kann 2024)
Anonim

Die gestrige Nachricht, dass Chinas Tianhe-2-Supercomputer jetzt der schnellste der Welt ist, ist nicht allzu schockierend. Immerhin stand 2010 eine frühere Version ganz oben auf der Liste der Supercomputer.

Was etwas überraschender ist, ist die Architektur hinter dem Tianhe-2 (auch bekannt als Milchstraße-2). Es basiert auf der neuen Xeon Phi-Architektur von Intel, die eine große Anzahl von x86-Kernen auf einem einzigen Chip vereint. Der Supercomputer kombiniert diese Chips dann zu einer einzigen Architektur. Es war nicht zu erwarten, dass dieses System noch einige Jahre in Betrieb sein würde. Daher war ich überrascht, dass ein Xeon Phi-basiertes System ganz oben auf der Liste stand. Was mich hier am meisten fasziniert, ist der Wettbewerb mit Systemen, die hauptsächlich auf GPU-Computing basieren. In der Tat liegt ein auf Nvidias CUDA-GPU-Kernen basierendes System, das das letzte Mal an der Spitze der Liste stand, nun an zweiter Stelle.

Die Top500-Liste der schnellsten Computer der Welt erscheint in der Regel zweimal im Jahr: einmal in Verbindung mit der Internationalen Supercomputing-Konferenz (ISC), die jetzt in Deutschland stattfindet, und erneut auf der Supercomputing-Konferenz (SC 13) im Herbst.

Der Tianhe-2 mit Sitz an der Nationalen Universität für Verteidigungstechnologie in Changsha, China, weist eine anhaltende Leistung von mehr als 33, 8 Petaflops (mehr als 17.500 Billionen Gleitkommaoperationen pro Sekunde) und eine Spitzenleistung von 54, 9 Petaflops auf dem LINPACK-Benchmark auf. Damit ist es etwa doppelt so schnell wie das Titan-System des US-Energieministeriums Oak Ridge National Laboratory (ORNL). Tianhe-2 verfügt über 16.000 Knoten mit jeweils zwei Intel Xeon E5-2692-Prozessoren (12-Kern-Prozessoren unter Verwendung der Ivy Bridge) und drei Xeon Phi-Prozessoren für insgesamt 3.120.000 Rechenkerne. Die Xeon-Kerne basieren auf einer kommenden 12-Core-Version der Xeon-Familie Nr. 5-2600, die auf der 22-nm-Ivy-Bridge-Architektur basiert. Das Gesamtsystem verbraucht 17, 8 MW, das meiste aller Top-Systeme in der Top-500-Liste. Da die Leistungszahlen jedoch so hoch sind, wird es immer noch als relativ energieeffizient angesehen. Die Juni-Liste der effizientesten Supercomputer, der Green500, ist in Kürze verfügbar.

Das Titan-System von ORNL, das an der Spitze der vorherigen Liste stand, belegt jetzt den zweiten Platz. Dies basiert auf einem Cray XK7-System mit 18.688 Knoten, die jeweils einen 16-Kern-AMD Opteron 6274 und einen Nvidia Tesla K20x-Grafikprozessorbeschleuniger (GPU) enthalten. Dieses System zeigt eine anhaltende Leistung von 17, 5 Petaflops (mehr als 17.500 Billionen Gleitkommaoperationen pro Sekunde) und eine Spitzenleistung von über 27 Petaflops im LINPACK-Benchmark. Das Sequoia-System im Lawrence Livermore National Laboratory, das auf dem BlueGene / Q-System von IBM und seinen Power-CPUs basiert, belegte vor einem Jahr den zweiten Platz in der Top500-Liste, rutschte jedoch auf den dritten Platz ab. Das System mit dem vierten Platz bleibt der "K-Computer" am japanischen RIKEN Advanced Institute for Computational Science, das auf SPARC64-Prozessoren von Fujitsu basiert.

Die oberen vier Systeme zeigen vier sehr unterschiedliche Architekturen. Herkömmliche Big-Iron-Systeme wie die auf den IBM-Architekturen BlueGene (Power) und Fujitsu SPARC basierenden sind nach wie vor sehr im Gange, aber das Hauptaugenmerk liegt auf der neuen Xeon Phi-Architektur von Intel und der CUDA-Architektur von Nvidia. In der Zwischenzeit gibt es weiterhin Berichte, dass China daran arbeitet, einen eigenen Prozessor für Supercomputing zu entwickeln.

Nvidia gab gestern bekannt, dass Forscher an der Stanford University GPUs verwenden, um das weltweit größte künstliche neuronale Netzwerk zu erstellen, mit dem modelliert werden soll, wie das menschliche Gehirn lernt. Es wurde auch bekannt gegeben, dass das CUDA-Toolkit nun ARM-basierte Plattformen unterstützen wird.

Im Rahmen der Supercomputing-Konferenz stellte Intel auch neue Versionen seiner Xeon Phi-Coprozessorfamilie vor, darunter die 7100 mit 61 Kernen, 1, 23 GHz Taktfrequenz, 16 GB Speicherkapazität und über 1, 2 TB Flops mit doppelter Genauigkeitsleistung. die Xeon Phi 3100-Familie mit 57 mit 1, 1 GHz getakteten Kernen und 1TFlops mit doppelter Genauigkeit; und eine neue 5100D, die so konstruiert ist, dass Sockel für die Verwendung in Blade-Formfaktoren an eine Mini-Platine angeschlossen werden können. Laut Intel wird die nächste Generation, die als "Knights Landing" bekannt ist und auf der bevorstehenden 14-nm-Prozesstechnologie basiert, nicht nur als Coprozessor, sondern auch als Primärprozessor fungieren und damit die Komplexität beim Verschieben von Daten in verschiedene Speicherpools verringern. Dadurch wird der Speicher des Pakets integriert, um die Leistung zu beschleunigen.

Intel nennt die Kombination aus traditionellen Xeon- und Xeon Phi-Prozessoren "neo-heterogene Architektur". Die Hardwarearchitektur verfügt über mehrere Klassen von Rechenfunktionen, auf die über ein gemeinsames Programmiermodell zugegriffen werden kann. Das Unternehmen betont, dass nur x86 die Entwicklung und Optimierung auf eine Weise rationalisieren kann, die bei Verwendung einer Kombination aus CPUs und GPU-Beschleunigern schwieriger wäre. Nvidia und die anderen Unternehmen, die GPU-Computing forcieren, würden dieser Einschätzung nicht zustimmen.

Intel sprach auch davon, Hochleistungs-Computing nicht nur für traditionelle Zwecke wie Regierungs- und Militärforschung und kommerzielle High-End-Anwendungen wie Öl- und Gassimulationen, sondern auch für Anwendungen wie Big Data einzusetzen. Ziel ist es, Supercomputing zum Mainstream zu machen.

Die vollständige Liste der Top500-Supercomputer finden Sie hier.

Der schnellste Supercomputer der Welt jetzt in China