Zuhause Vorausdenken Supercomputer rangiert weitgehend unverändert, sitzen aber fest

Supercomputer rangiert weitgehend unverändert, sitzen aber fest

Video: Japan’s Fugaku remains world’s fastest supercomputer (November 2024)

Video: Japan’s Fugaku remains world’s fastest supercomputer (November 2024)
Anonim

Die jüngste Liste der schnellsten Supercomputer der Welt änderte sich nicht viel, aber die jährliche Supercomputing-Show (SC14) enthielt zahlreiche Diskussionen über neue Systeme auf der Liste sowie mehrere Ankündigungen für Hochleistungscomputer wie neue Beschleuniger von Intel und Nvidia.

Der chinesische Supercomputer Tianhe-2, der Intel Xeon-CPUs und Xeon Phi-Beschleuniger verwendet, blieb mit einer Spitzenleistung von 54, 9 Petaflops (Billiarden Gleitkommaoperationen pro Sekunde) auf dem ersten Platz der Top500-Liste. Tatsächlich waren in diesem Jahr die neun besten Systeme identisch mit dem Top-Neuzugang auf Platz 10 - eine nicht spezifizierte US-Regierungssystemmaschine, die ein Cray CS-Storm ist, der von Intel Xeon E5-2660 v2-CPUs und Nvidia K40-GPUs angetrieben wird, die über verbunden sind Infiniband.

Weiter unten auf der Liste gab es 78 neue Systeme, auch wenn dies ein neues Rekordtief ist. Insgesamt scheint sich die Wachstumsrate der Gesamtleistung der 500 Systeme zu verlangsamen.

Die Rangfolge dieser Systeme basiert auf dem LINPACK-Benchmark, obwohl derzeit eine Reihe von Anstrengungen unternommen werden, um neue Benchmarks für verschiedene Arten der Datenverarbeitung zu erstellen. Ich fand es interessant, dass Horst Simon, Herausgeber der Top500-Liste, in einer Rede auf der Messe sagte, dass er trotz des Ziels, einen Exascale-Computer - 1 Exaflop pro Sekunde (ungefähr 1.000 Petaflops) - bis 2020 zu erreichen, davon ausgeht, dass dies wahrscheinlich sein wird Nehmen Sie uns bis Ende 2024 mit. Dies liegt zum Teil daran, dass wir energiesparendere Techniken wie Siliziumphotonik und 3D-Integration und -Package benötigen, um die für ein Exascale-System erforderliche Leistung auf 20 Megawatt zu begrenzen. Das sind große Systeme.

Trotz des Mangels an großen Änderungen an der Spitze hörten wir einige neue Ankündigungen, insbesondere von Intel und Nvidia, die den Weg zu schnelleren Maschinen weisen könnten.

Nvidia, dessen GPUs und CUDA-Programmiersprache den Weg zu Beschleunigern und Coprozessoren im Hochleistungs-Computing wirklich eingeschlagen haben, war auf der ganzen Messe mit vielen Systemen vertreten. Derzeit wird der K40-Beschleuniger angeboten, und auf der Messe wurde die nächste Version, der Tesla K80, angekündigt, der nach Angaben des Unternehmens über einen Dual-GPU-Ansatz eine fast zweifach höhere Leistung und die doppelte Speicherbandbreite des Vorgängers bietet.

Laut Nvidia bietet der K80 4.992 CUDA-Kerne und 24 Megabyte RAM und hat eine maximale Kapazität von 2, 91 Teraflops pro Board. Es ist interessant, dass der K80 jetzt verfügbar ist und dass viele Systemhersteller bereits Systeme mit dem Board anbieten. Zum Beispiel zeigte Dell seine neuen PowerEdge C4130-Server, mit denen Sie bis zu vier Nvidia-Beschleunigerplatinen (oder Intel Xeon Phi-Beschleuniger) in einen 1U-Server einbauen können. Die K80-Version bietet bis zu 7, 2 Teraflops in jeder Box. Das ist nur eine verrückte Menge an Rechenleistung in einem Rack (obwohl eine, die viel Energie verbraucht und viel Kühlung benötigt).

In der Zwischenzeit gab Intel bekannt, dass die nächste Version seines Xeon Phi - Chips - eine als Knight's Landing bekannte Version, für die die ersten kommerziellen Systeme im nächsten Jahr ausgeliefert werden sollen - mehr als 50 Kunden die Verwendung der neuen Prozessorversion des Teils (wo Der Xeon Phi fungiert als Systemprozessor in neuen Supercomputern. Viele weitere Systeme verwenden die Coprozessor-PCIe-Kartenversion des Produkts.

Zu den Kunden von Knights Landing zählen der Trinity-Supercomputer, ein Gemeinschaftsprojekt von Los Alamos und Sandia National Laboratories, und der Cori-Supercomputer, die vom National Energy Research Scientific Computing (NERSC) des US-Energieministeriums (DOE) angekündigt wurden. Knight's Landing soll etwa 3 Teraflops an Leistung bieten und die auf Siliziumphotonik basierende Omni-Path Fabric-Technologie von Intel integrieren, die laut Angaben des Unternehmens eine Leitungsgeschwindigkeit von 100 Gbit / s und eine um bis zu 56 Prozent geringere Switch Fabric-Latenz als InfiniBand-Alternativen bietet. (Beachten Sie, dass die InfiniBand-Anbieter jetzt auch über neue Versionen sprechen.)

Intel sagte, dass das Nachfolgemodell, bekannt als Knight's Hill, unter Verwendung der 10-nm-Prozesstechnologie von Intel und der nächsten Generation des Omni-Path-Gewebes gebaut wird. Es wird Knight's Landing folgen, aber der genaue Zeitpunkt wurde nicht bekannt gegeben.

Nicht zu vergessen ist AMD, das seine FirePro S9150 Single-CPU-Karte vorstellte und vorstellte, die 2, 53 Teraflops an Leistung bieten kann. Dieses mit OpenCL programmierte System wird bereits ausgeliefert.

Ein neuer Supercomputer namens L-CSC vom GSI Helmholtz Center, der auf den S9150-GPUs und den Intel Xeon 2690v2-10-Core-CPUs basiert, führte die neue Version der Green500-Liste an, in der Supercomputer in der Reihenfolge der Verarbeitungsleistung pro Watt aufgelistet sind. Dies war das erste Mal, dass ein System 5 Gigaflops / Watt (Milliarden Operationen pro Sekunde und Watt) überschritt. Beachten Sie, dass das zweitplatzierte System der Suiren war, der mit PEZY-SC-Mehrkernbeschleunigern und Xeon-CPUs ausgestattet war. Die übrigen Top 10 verwenden Nvidia Tesla-GPUs, was die Bandbreite solcher Systeme zeigt.

Es gibt auch andere, ungewöhnlichere Optionen. Micron zeigt seinen Automata-Chip, im Wesentlichen einen speziellen Chip für den Mustervergleich, der unter anderem für die Netzwerksicherheit und die Suche nach Genomen verwendet werden kann. Diese wird zu einer PCIe 3-Karte mit 32 Chips weiterentwickelt und soll im ersten Quartal 2015 zunächst in kleinen Stückzahlen auf den Markt gebracht werden. (Das Unternehmen steckt auch hinter seinem Hybrid Memory Cube für Speicher der nächsten Generation für solche Systeme.) IBM hat seinen TrueNorth-Prozessor, von dem es hofft, dass er den Weg zu mehr "gehirnartigem Computing" weist. NEC arbeitet an der nächsten Generation seines SX-ACE-Vektorprozessors, der seiner Meinung nach einfacher zu programmieren ist als GPUs. Und natürlich versucht ARM auch, auf dem Servermarkt Fuß zu fassen, da das X-Gene1 von Applied Micro als Prozessor für die Verbindung mit verschiedenen Beschleunigerkarten verwendet wird.

Eine Reihe von Anbietern zeigte neue Systeme. Zusätzlich zu dem zuvor erwähnten Dell-System zeigte Lenovo ein wassergekühltes Dual-Prozessor-System, das auf einem benutzerdefinierten Intel Xeon E5-2798A-Prozessor (mit 16 Kernen mit einer Geschwindigkeit von bis zu 3, 2 GHz) basiert und 1, 083 Teraflops liefert. Und es hieß, dass der Knights Landing Xeon Phi-Prozessor im nächsten Jahr ein "Peta-Cube" -System ermöglichen wird, das mehr als ein Petaflop in nur zwei Standard-42U-Racks liefert.

One-Stop-Server zeigten einen High-Density-Compute-Beschleuniger, der PCIe Gen3 zur Unterstützung von bis zu 16 High-End-Beschleunigerkarten von einem oder mehreren Servern verwendet. Das Unternehmen gab an, dass mit Tesla K80-Karten bis zu 89, 6 Teraflops bereitgestellt werden. Dies kann mit dem Power8-Prozessor von IBM funktionieren. Huawei zeigte die US-Verfügbarkeit seines X6800 Data Center Servers und einer flüssigkeitsgekühlten Version seines FusionServer 9000 Blade Servers.

Um Systeme miteinander zu verbinden, startete Obsidian Technologies seine InfiniCortex-Initiative, die eine 100-Gigabit-InfiniBand-Verbindung über große Entfernungen ermöglicht. Das Unternehmen kündigte Unterstützung von Singapurs Agentur für Wissenschaft, Technologie und Forschung (A * STAR) an. Und Mellanox zeigte 100 Gigabit Infiniband, das über 100 Meter über Glasfaser und 8 Meter über Kupfer arbeitet.

Um die größten Supercomputer zu entwickeln, wenden sich Unternehmen in der Regel an Unternehmen wie IBM und Cray, um die Systeme zusammenzustellen. Der Aufbau dieser Systeme dauert jedoch oft Jahre. Crays größte Ankündigung dieser Art auf der Messe war ein 80-Millionen-Dollar-System namens Shaheen II an der König-Abdullah-Universität für Wissenschaft und Technologie in Saudi-Arabien für einen Cray XC40, einschließlich einer Urika-GD-Graphanalyse-Appliance.

Und natürlich vergab das DOE kurz vor der Messe einen Großauftrag an IBM (und die Komponentenhersteller Nvidia und Mellanox) für die beiden größten Supercomputer des Landes mit jeweils mehr als 100 Petaflops.

Anmerkung des Herausgebers: Dieser Beitrag wurde am 26.11. Aktualisiert. Der Tianhe-2 hat eine Spitzenleistung von 54, 9 Petaflops, keine Teraflops.

Supercomputer rangiert weitgehend unverändert, sitzen aber fest