Zuhause Vorausdenken Wir bekommen zwei riesige neue Supercomputer

Wir bekommen zwei riesige neue Supercomputer

Video: USA wollen Coronakrise mit Schnelltests in Griff bekommen (November 2024)

Video: USA wollen Coronakrise mit Schnelltests in Griff bekommen (November 2024)
Anonim

Die US-Regierung hat heute eine große Wette abgeschlossen, dass schnellere Supercomputer helfen werden, einige der größten Probleme in der Wissenschaft zu lösen. Sie plant den Bau von zwei riesigen Supercomputern, von denen jeder um ein Vielfaches schneller wäre als die schnellsten Maschinen von heute.

Dies beinhaltet 325 Millionen US-Dollar für den Bau der neuen Supercomputer, einschließlich einer neuen Maschine namens Summit in den Oak Ridge National Laboratories (ORNL) und einer weiteren namens Sierra im Lawrence Livermore National Laboratory (LLNL) sowie 100 Millionen US-Dollar für Forschung und Entwicklung im Extrembereich skalieren Supercomputing-Technologie in einem Programm namens FastForward2. Summit wird voraussichtlich 150 bis 300 Spitzen-Petaflop / s (Billiarden Gleitkomma-Berechnungen pro Sekunde) und Sierra über 100 Petaflop / s liefern, verglichen mit 54, 9 Spitzen-Petaflop / s der schnellsten Maschine von heute (der Tianhe-2) auf der Straße in Richtung "Exascale Computing."

Um dies ins rechte Licht zu rücken: Die Gesamtrechenleistung der Top500-Systeme betrug vor einigen Monaten 274 Petaflop / s (eine neue Top500-Liste wird nächste Woche in Verbindung mit der SuperComputing 14-Show veröffentlicht). Beide Systeme werden von IBM entwickelt und basieren auf IBM Power-Architektur-CPUs, Nvidia Tesla-GPUs und Mellanox-Interconnects.

Tom Rosamilla, Senior Vice President der IBM Systems & Technology Group, beschrieb die Systeme als eine neue "datenzentrierte Architektur", mit der Datenbewegungen so weit wie möglich vermieden werden sollen, indem die Daten näher am Computer platziert werden. IBM ist der Ansicht, dass dies eine hochmoderne, kostengünstige Modellierung, Simulation, Anwendung und Analyse von Big Data ermöglichen soll und nutzt die OpenPower-Initiative (der Nvidia und Mellanox angehören).

Als Teil davon werden Nvidia Tesla-GPUs verwendet, die auf der bevorstehenden Volta-Architektur (die 2017 nach der 2016 geplanten Pascal-Architektur fällig wird) und der NVLink-Technologie des Unternehmens für Verbindungen zwischen allen Prozessoren in einem einzelnen Serverknoten basieren. Sumit Gupta, General Manager von Tesla GPU Accelerated Computing für Nvidia, beschrieb NVLink als die "erste Hochgeschwindigkeitsverbindung für die GPU", die eine Punkt-zu-Punkt-Kommunikation zwischen einer GPU und einer anderen GPU sowie zwischen der GPU und der ermöglicht Power CPU. (Die erste Generation von NVLink ist für 2016 vorgesehen; die neuen Systeme werden die zweite Generation verwenden.) Die Knoten innerhalb der Systeme werden mit der nächsten Generation von Mellanox EDR 100-Gb / s-InfiniBand-Interconnect verbunden.

IBM sagte, dass jedes System eine Spitzenleistung von "weit über 100 Petaflops" haben wird, die mit mehr als fünf Petabyte dynamischem und Flash - Speicher ausgeglichen wird, und in der Lage sein wird, Daten mit mehr als 17 Petabyte pro Sekunde auf den Prozessor zu übertragen (was die Das Unternehmen gibt an, mehr als 100 Milliarden Fotos pro Sekunde zu bewegen.

Jeffrey Nichols, stellvertretender Labordirektor für ORNLs Computer- und Computerwissenschaften, beschrieb die Architektur als "eine geringere Anzahl von Knoten mit viel größerem gemeinsamen Speicherbedarf" und sagte, dies sollte Entwicklern ermöglichen, die parallelen Lasten, die derzeit auf ORNLs aktuellem Stand sind, zu optimieren und effizienter auszuführen Titan-System. Laut ORNL wird das Summit-System mehr als 3400 Knoten umfassen, wobei jeder Knoten mehrere IBM Power 9-Prozessoren und mehrere Nvidia Volta-GPUs mit mehr als 512 GB DDR4 und Speicher mit hoher Bandbreite umfasst (in einem kohärenten Design, sodass es mit allen zusammenarbeiten kann) CPUs und GPUs) zusammen mit 800 GB nichtflüchtigem RAM für über 40 Teraflops Spitzenleistung. Es wird ein GPFS-Speicherserversystem mit einer E / A-Bandbreite von 1 TB / s und einer Festplattenkapazität von 120 PB haben. Dies sollte schließlich das derzeitige Titan-System von ORNL ersetzen, das auf AMD Opteron-Prozessoren und Nvidia Kepler-CPUs basiert und 27 Petaflop / s unterstützt. Nichols zufolge sollte Summit die 5- bis 10-fache Leistung von Titan erbringen. Summit wird voraussichtlich 2017 ausgeliefert und steht den Nutzern 2018 zur Verfügung.

Die Zielanwendungen für das Summit-System umfassen Verbrennungswissenschaften (die versuchen, den Wirkungsgrad von Verbrennungsmotoren um 25 bis 50 Prozent zu steigern), Klimawandelwissenschaften, Energiespeicherung und Kernkraft. Nichols sagte, der Summit sollte es ORNL ermöglichen, den Horizont der Wissenschaft, die sie in den Labors betreiben, zu erweitern.

Das LLNL-System mit der Bezeichnung Sierra zielt auf das Advanced Simulation and Computing (ASC) -Programm der National Nuclear Security Administration (NNSA) ab, das hauptsächlich auf die Bereiche Waffenkunde und -bewertung ausgerichtet ist. Laut Mike McCoy, dem ASC-Programmdirektor von LLNL, ermöglicht der Supercomputer dem Labor, Simulationen des Atomlagers des Landes durchzuführen, ohne erneut Atomtests durchführen zu müssen. Er sagte, der 3D-Waffensimulationscode des Labors sei "eine der kompliziertesten Anwendungen der Welt". Er merkte an, dass dies nicht der Fall sei, dass die Regierung ein Standardsystem kaufe, sondern vielmehr ein "Co-Design", bei dem die Programmierer und Systementwickler gemeinsam an der Architektur arbeiten.

Beide Systeme, die Teil eines Programms des Energieministeriums sind, das unter der Bezeichnung Collaboration of Oak Ridge, Argonne und Lawrence Livermore National Labs (CORAL) bekannt ist, zielen darauf ab, die Entwicklung von Hochleistungsrechnern zu beschleunigen. IBM sagt, dass die Programmierung für solche Systeme heute beginnen kann, aber die Systeme werden erst 2017 oder 2018 installiert. Als Teil des CORAL-Programms wird Argonne National Lab auch neues Supercomputing erhalten, hat es aber noch nicht angekündigt.

Insgesamt sagte Nichols, er betrachte Summit und Sierra als "frühe Schritte in Richtung Exascale" und freue sich auf zukünftige Systeme auf dem gleichen architektonischen Weg und hoffe auf eine lange Zusammenarbeit mit den Anbietern. Etwa fünf Jahre nach der Übergabe des Gipfels hoffe er auf einen exascale-Computer.

Darüber hinaus gab AMD heute bekannt, dass es im Rahmen des FastForward2-Projekts zwei DOE-Preise in Höhe von 32 Millionen US-Dollar erhalten hat, um die exascale Knotenarchitektur auf der Grundlage seiner auf der Heterogenen Systemarchitektur (HSA) basierenden Accelerated Processing Units (APUs) zu erforschen und beim Entwurf einer neuen zu helfen Standard für zukünftige Speicherschnittstellen. Laut DOE werden AMD, Cray, IBM, Intel und Nvidia die FastForward2-Projekte leiten. (Intel und Cray sind nicht an den heute angekündigten Supercomputern beteiligt, spielen aber weiterhin eine große Rolle im Weltraum. Es wird also interessant sein zu sehen, ob sie an Argonnes Plänen beteiligt sind.)

Wir bekommen zwei riesige neue Supercomputer