Video: SC19 Birds of a Feather: TOP500 Supercomputers (November 2024)
Zweimal im Jahr, zeitlich abgestimmt auf die großen Supercomputing-Shows, veröffentlicht eine Gruppe von Branchenexperten eine Liste der schnellsten Supercomputer der Welt. Die neueste Top500-Liste wurde gestern in Verbindung mit der International Supercomputing Conference veröffentlicht, und der Tianhe-2-Supercomputer, der von der chinesischen Nationalen Universität für Verteidigungstechnologie entwickelt wurde, konnte sich zum dritten Mal in Folge an der Spitze behaupten.
Tatsächlich sind die neun wichtigsten Systeme auf der Liste unverändert gegenüber der Vorgängerversion, die im November herauskam. Dennoch gibt es einige interessante Dinge zu beachten.
Die USA bleiben mit 233 das Top-Land in Bezug auf Gesamtsysteme, aber dies ist ein Rückgang von 265 im November. Inzwischen ist die Anzahl der Systeme in China von 63 auf 76 gestiegen. Gegenwärtig stehen 37 Systeme mit einer Leistung von mehr als einem Petaflop / s auf der Liste, nach 31 vor sechs Monaten.
62 der Top-500-Systeme verwenden irgendeine Art von Beschleuniger- oder Coprozessortechnologie, gegenüber 53 ab November. 44 davon verwenden Nvidia-Chips, zwei ATI Radeon und es gibt mittlerweile 17 Systeme mit Intel MIC-Technologie (Xeon Phi). Die durchschnittliche Anzahl der Beschleunigerkerne für diese 62 Systeme beträgt 78.127 Kerne / System.
Sowohl das Top-System Tianhe-2 als auch das Stampede-System Nr. 7 des Texas Advanced Computing Center der University of Texas verwenden Intel Xeon Phi-Prozessoren, um die Rechengeschwindigkeit zu erhöhen.
Das System Nr. 2, der Titan des Oak Ridge National Laboratory, und das System Nr. 6, Piz Daint vom Swiss National Supercomputing Center, verwenden Nvidia-GPUs, um die Berechnung zu beschleunigen.
Intel liefert weiterhin die Prozessoren für den größten Anteil (85, 4 Prozent) der Top500-Systeme. Der Anteil der IBM Power-Prozessoren liegt weiterhin bei 8 Prozent, während die AMD Opteron-Familie in 6 Prozent der Systeme verwendet wird, verglichen mit 9 Prozent in der vorherigen Liste. 96% der Systeme verwenden Prozessoren mit sechs oder mehr Kernen und 83% verwenden acht oder mehr Kerne.
Dies alles ist beeindruckend, aber das Leistungswachstum scheint sich zu verlangsamen. Die Gesamtleistung aller 500 Systeme ist auf 274PF gestiegen, verglichen mit 250PF vor sechs Monaten und 223PF vor einem Jahr. Das scheint viel zu sein, aber es ist tatsächlich viel langsamer als das Wachstum, das wir vor ein paar Jahren sahen, weil es weniger der extrem High-End-Supercomputer gibt, die um die Spitze der gebauten Tabelle wetteifern.
Dies könnte sich durch einige neue Ankündigungen ändern, die Supercomputing beschleunigen sollen.
Nvidia gab heute bekannt, dass seine Tesla-GPU-Beschleuniger auf 64-Bit-ARM-Prozessoren erweitert werden. Insbesondere wurde die Unterstützung von Servern mit ARM64-CPUs von Applied Micro X-Gene und Tesla K20-GPU-Beschleunigern von Nvidia angekündigt. Es wurden keine Kunden angekündigt, obwohl Nvidia davon ausgeht, dass solche Systeme Hunderte bestehender HPC-Anwendungen verwenden können, die bereits das CUDA-Schema von Nvidia für Beschleuniger verwenden, indem sie einfach auf 64-Bit-ARM-Systeme neu kompiliert werden.
Nvidia hat bereits angekündigt, die Verwendung seiner Beschleuniger mit der Power-CPU-Familie von IBM zu unterstützen. Bisher verwenden jedoch alle Systeme, die die Nvidia Tesla-Beschleuniger verwenden, x86-Prozessoren von Intel oder AMD (z. B. das Titan-System, das AMD Opterons mit den K20-Beschleunigern kombiniert).
Dennoch scheint es Anwendungen zu geben, die in erster Linie auf der GPU basieren, bei denen ein Prozessor mit geringerer Leistung wie die ARM 64-Architektur sinnvoll wäre.
Auf Intels Seite kündigte das Unternehmen eine Reihe neuer Details für den nächsten Generator seiner Xeon Phi-Prozessoren an, der als Knights Landing bekannt ist. Dazu gehören eine neue Hochgeschwindigkeitsverbindung mit der Bezeichnung Omni Scale Fabric und ein On-Package-Speicher, der Speicher und CPU in einem einzigen Chip kombiniert (wenn auch mit mehreren Chips).
Knights Landing, das in der zweiten Jahreshälfte 2015 erscheinen soll, wird mehr als 60 HPC-fähige Silvermont Atom-Kerne verwenden. und Intel sagt, dass es mehr als 3 TFLOPS mit doppelter Genauigkeit und dreimal mehr Single-Thread-Leistung als das aktuelle Xeon Phi liefern wird.
Die neue Struktur soll in Knights Landing sowie in zukünftigen Versionen der Allzweck-Xeon-Prozessoren des Unternehmens enthalten sein und soll eine bessere Leistung bieten als die derzeit von Intel angebotene True Scale-Struktur. Der mit Micron eingeführte Speicher bietet bis zu 16 GB Hochgeschwindigkeitsspeicher, der laut Intel im Vergleich zu DDR 4-Speicher eine fünfmal höhere Bandbreite und eine fünfmal höhere Energieeffizienz sowie eine dreimal höhere Bandbreite als der GDDR-Speicher bieten kann Wird normalerweise mit Beschleunigern verwendet.
Laut Intel werden die Cori-Supercomputer des National Energy Research Scientific Computing Center des Lawrence Berkeley National Laboratory mehr als 9.300 Knights Landing-Prozessoren verwenden.
Es scheint, als ob Intel entschlossen ist, das Ziel einer exascale-Maschine bis 2020 zu erreichen, und eine Menge Technologie zusammenbringt, um dorthin zu gelangen. Es wird interessant sein zu sehen, ob Power, ARM und / oder Nvidia diesem Ziel glaubwürdigen Wettbewerb bieten können.