Zuhause Vorausdenken Supercomputing 17 bietet einige Überraschungen und Tipps für die Zukunft

Supercomputing 17 bietet einige Überraschungen und Tipps für die Zukunft

2024

Video: 2020 Seminar Series: Intro to Supercomputing (November 2024)

Es gab einige Überraschungen auf der diesmonatigen Supercomputing 17-Konferenz, darunter eine sehr gute Präsentation für den Beschleuniger PEZY-SC2 sowie Intels Richtungswechsel für seine Xeon Phi-Linie. Darüber hinaus haben wir die ersten Systeme gesehen, die auf dem skalierbaren Intel Xeon-Prozessor (Skylake) basieren, und die ersten, die mit dem Volta-Beschleuniger von Nvidia ausgestattet sind.

Am bemerkenswertesten ist jedoch die Nachricht, dass in China derzeit 202 der 500 Supercomputer auf der neuesten Top 500-Liste stehen, verglichen mit nur 143 aus den USA. Amerikanische Systeme haben die Liste seit ihrer Einführung vor 25 Jahren dominiert, und vor wenigen Monaten hatten die USA 169 Systeme für Chinas 160. Gleiches gilt für die Gesamtleistung, wobei die chinesischen Systeme zusammen 35, 4 Prozent ausmachen die Gesamtleistung der Top 500-Systeme.

Die schnellsten Computer der Welt sind nach wie vor die beiden großen chinesischen Maschinen, die seit mehreren Jahren an der Spitze der Liste stehen: Sunway TaihuLight vom chinesischen National Supercomputing Center in Wuxi mit einer anhaltenden Linpack-Leistung von mehr als 93 Petaflops (93.000 Billionen Gleitkomma) Operationen pro Sekunde) und der Tianhe-2 aus dem chinesischen Super-Computer-Zentrum in Guangzhou mit einer anhaltenden Leistung von mehr als 33, 8 Petaflops. Dies sind mit Abstand die schnellsten Maschinen. Das Piz Daint-System des Schweizerischen Nationalen Supercomputing-Zentrums, ein Cray-System, das Intel Xeons und Nvidia Tesla P100s verwendet, belegte mit einer anhaltenden Leistung von 19, 6 Petaflops den dritten Platz.

Die größte Veränderung an der Spitze ist ein neues System auf dem vierten Platz: eine aktualisierte Version des Supercomputers Gyoukou, eines ZettaScaler-2.2-Systems, das bei der japanischen Agentur für Marine-Erdwissenschaft und -technologie eingesetzt wird. Diese Maschine verwendet PEZY-SC2-Beschleuniger, einen 2048-Kern-Chip der zweiten Generation, der eine Spitzenleistung von 4.096 Teraflops mit doppelter Präzision bietet, sowie herkömmliche Intel Xeon-Prozessoren für insgesamt 19.860.000 Kerne. (Eine frühere ZettaScaler-Maschine mit dem PEZY-SC2 hat die Liste in der Juni-Version auf einer niedrigeren Ebene erstellt.) Dies gibt ihm die höchste Anzahl von Kernen, die zusammen verwendet werden - auch bekannt als das höchste Maß an Nebenläufigkeit -, die bisher gesehen wurden und übertrifft das TaihuLight mit 10, 6 Millionen Kernen. Die Gyoukou-Maschine erreichte eine anhaltende Linpack-Leistung von 19, 14 Petaflops. Interessant ist jedoch, dass sie 1, 35 Megawatt Leistung verbraucht, verglichen mit 2, 27 Megawatt für PizDaint, 17, 8 Megawatt für Tinahe-2 und 15, 4 Megawatt für Taihulight. Das ist immer noch viel Energie, aber es ist eine große Reduzierung im Vergleich zu den anderen Systemen und ein starkes Indiz dafür, dass Energieprobleme auch für die schnellsten Maschinen der Welt wichtig sind. Es ist auch erwähnenswert, dass dies zeigt, wie neue Architekturen den Stromverbrauch drastisch reduzieren können.

Das US-amerikanische Top-System ist nach wie vor der Titan-Supercomputer im Oak Ridge National Laboratory, einem fünf Jahre alten System, das Nvidia K20x-GPU-Beschleuniger verwendet und 17, 59 Petaflops liefert. Damit steht es auf Platz fünf der Liste.

In der neuesten Green 500-Liste der energieeffizientesten Supercomputer gingen vier der fünf besten Steckplätze - einschließlich der drei besten - an neu installierte japanische Systeme, die alle auf der ZettaScaler-2.2-Architektur und dem PEZY-SC2-Beschleuniger basieren. Am effizientesten ist das Shoubu-System B, das im Advanced Center for Computing and Communication von RIKEN installiert wird. Das Shoubu-System B erreichte 17, 0 Gigaflops / Watt; Shoubu System B und die nächsten beiden Systeme, die 16, 8 und 16, 7 Gigaflops / Watt verwenden, befinden sich alle in der unteren Hälfte der Top 500-Liste. Das fünfte System im Green-Ranking ist das oben erwähnte Gyoukou-System - das System Nummer vier in der Top 500-Liste mit 14, 2 Gigaflops / Watt.

Dies sind große Durchbrüche für den Beschleuniger PEZY-SC2, die möglicherweise auf zukünftige Richtungen für Supercomputing-Architekturen hindeuten.

Der viertgrünste Supercomputer ist Nvidias internes DGX SaturnV Volta-System mit 15, 1 Gigaflops / Watt und Platz 149 in der Top 500-Liste. Dieses System hat 22.440 Volta-Kerne (die auf der Liste anscheinend etwas anders gezählt werden als einige der anderen Kerne). Nvidia hatte ein sehr gutes Jahr für seinen Beschleuniger und hofft auf mehr Maschinen, die den Volta verwenden GPU-Architektur.

Wie üblich schwärmten die großen Anbieter von Erfolgen auf der Liste, wobei Intel feststellte, dass sich die CPUs in sechs der Top-Ten-Systeme befanden und mit 471 von 500 Systemen ein Rekordhoch verzeichneten. Intel merkte auch an, dass seine neuen Xeon Scalable-Prozessoren in 18 Supercomputern mit über 25 Petaflops Leistung steckten. Bemerkenswerter ist jedoch, dass Intel Knights Hill, den geplanten 10-nm-Nachfolger des 14-nm-Knights-Landing-Xeon-Phi-Prozessors, annulliert. Das Unternehmen plant derzeit eine neue Plattform für Exascale-Systeme (1.000 Petaflops) bis 2021, gab jedoch keine Details bekannt.

Nvidia betonte, dass es 34 neue Systeme mit Beschleunigern auf der Liste habe, so dass sich das Unternehmen auf 87 beläuft. Nvidia und Partner IBM waren besorgt über die Möglichkeit, dass die Summit-Maschine bei Oak Ridge zum Zeitpunkt der nächsten Liste im Juni erhältlich sein könnte Das National Laboratory (ORNL) sollte zu den Maschinen gehören, die ganz oben auf der Liste stehen. Diese Maschine verfügt über 4600 Knoten mit jeweils zwei IBM Power 9-Basis-CPUs und 6 Nvidia Volta-Beschleunigern mit einer prognostizierten Leistung von etwa 200 Petaflops. Dies unterscheidet sich von der internen Lösung von Nvidia darin, dass die CPUs und GPUs alle über NVLink 2.0 cachekohärent über OpenCAPI kommunizieren, sodass die GPUs direkt auf den Hauptsystem-RAM zugreifen können. Auf den Gipfel folgen der Sierra-Rechner im Lawrence Livermore National Laboratory und der AI Bridging Cloud Infrastructure-Rechner (ABCI) in Japan.

Ich war interessiert zu hören, wie Cray einen "serienreifen" Supercomputer auf der Basis des Cavium ThunderX2-Prozessors auf der 64-Bit-Armv8-A-Architektur ankündigte, der jetzt als Teil seines XC50-Supercomputers erhältlich ist. ARM-basierte Maschinen werden im Barcelona Supercomputer Center (dessen Mare Nostrum-Maschine jetzt auf Platz 16 der Top 500-Liste steht) sowie im japanischen "Post-K" -Supercomputer und im britischen Isambard-Supercomputer getestet. Cavium hatte einige frühe Benchmarks für den ThunderX2, die zeigten, dass der 14-nm-Chip bei Multithread- oder speichergebundenen Anwendungen besser abschneidet als Intels Skylake Xeons, obwohl Intel bei Single-Thread- und Raw-Teraflops weiterhin führend ist. Beachten Sie, dass Qualcomm neben dem Cavium-Design auch einen ARM-basierten Serverchip namens Centriq angekündigt hat.

In anderen Prozessor-News gab AMD bekannt, dass die Produktion seiner Epyc-Prozessoren hochgefahren wurde, obwohl diese noch nicht in den Top 500-Systemen enthalten sind, und NEC kündigte Versionen seiner PCIe-Beschleunigerkarte Vector Engine für die neue Supercomputerserie SX-Aurora TSUBASA an, die haben eine besonders schnelle Speicherbandbreite.

Auf der Interconnect-Seite gab Mellanox an, dass 77 Prozent der neuen Systeme auf der Top 500-Liste InfiniBand verwenden, während Intel die jüngsten Erfolge mit seiner Omni-Path-Architektur anprangerte, die hauptsächlich in Xeon-Systemen mit skalierbarem Prozessor (Skylake) zum Einsatz kommt. Mittlerweile setzen einige Hersteller auf Gen-Z, ein speicherorientiertes Verfahren mit geringerer Latenz für sehr schnelle Verbindungen zwischen Computern und Speichergeräten.

Interessant ist auch, dass zum ersten Mal auf allen Rechnern der Top 500 Linux ausgeführt wird.

Zwischen dem starken ersten Eindruck von PEZY-SC2, der Entscheidung von Intel, Knights Mill für eine neue Architektur, Nvidia's Volta, und der neuen Konkurrenz von AMD, ARM-Anbietern und NEC, ist jetzt eine aufregende Zeit in der Welt des Supercomputing. Die Listen für das nächste Jahr dürften interessant sein, da wir sehen, welche Architekturen wirklich funktionieren und welche am effizientesten sind, da viele Anbieter und Supercomputer-Sites versuchen, sich im Wettlauf um einen Exascale-Computer (1000 Petaflop) mit einem Sub zu positionieren -20 Megawatt Leistungsaufnahme.

Neugierig auf Ihre Breitband-Internetgeschwindigkeit? Testen Sie es jetzt!