Video: Machine Learning on FPGAs: Neural Networks (November 2024)
Ein Großteil der interessanten Prozessordiskussion drehte sich in letzter Zeit um die Verwendung verschiedener Arten von Chips und Kernen im Gegensatz zu den Allzweck-Rechenkernen, die bei herkömmlichen CPUs üblich sind. Wir haben alle möglichen Kombinationen von Chips gesehen, die für bestimmte Computeraufgaben verwendet werden, einschließlich CPUs, GPUs, DSPs, benutzerdefinierten ASICS und feldprogrammierbaren Gate-Arrays (FPGs), und wir sehen zunehmend Anwendungen, die Aspekte von allem kombinieren diese, manchmal in einem System und manchmal innerhalb eines einzelnen Chips.
Sogar Intel - lange Zeit der Befürworter von Allzweck-Rechenkernen, deren Geschwindigkeit sich alle paar Jahre verdoppelte - hat mit dem Kauf von Altera, einem der führenden FPGA-Hersteller, Einzug gehalten. Vor kurzem hatte ich die Gelegenheit, mit Dan McNamara, General Manager der Programmable Solutions Group (PSG) von Intel, zu sprechen, der die Pläne von Intel in diesem Bereich näher beleuchtete und die Pläne des Unternehmens für den Anschluss näher erläuterte Verschiedene Arten von Kernen und verschiedene Chips zusammen in Hochgeschwindigkeits-Chip-Paketen.
"Die Welt wird heterogen", sagte McNamara und merkte an, dass es mittlerweile eine allgemeine Erkenntnis gibt, dass man nicht alle Probleme mit Allzweckkernen lösen kann. Benutzerdefinierte ASICs - wie die Tensor Processing Units oder TPUs von Google - können bestimmte Funktionen weit über die herkömmlichen CPUS- oder GPU-Funktionen hinaus beschleunigen. Die Erstellung dieser Funktionen dauert jedoch lange. Im Gegensatz dazu ermöglichen FPGAs anpassbaren Code, der einen Großteil der Leistungsvorteile von ASICs bietet, ohne zwei Jahre auf das Design und die Herstellung von Chips warten zu müssen. Ein Entwickler kann die Algorithmen in einem FPGA sofort ändern, während eine CPU, eine GPU oder ein benutzerdefinierter Chip fest arbeiten.
McNamara sagte auch, dass FPGAs eine sehr geringe Latenz aufweisen und sehr parallel sein können, wobei verschiedene Teile eines Chips gleichzeitig an Anwendungen wie der Bildverarbeitung oder der Kommunikation arbeiten.
Intel liefert ab sofort das Arria 10-FPGA aus, das mit dem 20-nm-Prozess von TSMC hergestellt wurde, und bietet ein Paket an, das einen Xeon-Prozessor (Broadwell) und das Arria 10 kombiniert. Laut McNamara könnten FPGAs die Suche um das Zehnfache beschleunigen, und Microsoft hat öffentlich darauf hingewiesen, dass solche FPGAs zur Beschleunigung der Suche eingesetzt werden.
Ein großer Verbesserungsbereich in letzter Zeit war die Entwicklung schnellerer Mehrchip-Gehäuse, die Chip-Dies kombinieren können, die in verschiedenen Prozessen und möglicherweise von verschiedenen Herstellern hergestellt wurden. Dazu gehören Pakete, die eine CPU und ein FPGA enthalten, z. B. die Kombination Xeon / Arria. ein FPGA mit verschiedenen Transceivern, wie im Stratix 10-FPGA von Intel; oder sogar verschiedene Teile einer vollständigen CPU, wie Intel in seinem jüngsten Technologie- und Fertigungstag beschrieben hat.
Intel hat hierfür eine neue Technologie namens EMIB (Embedded Multi-Chip Interconnect Bridge) entwickelt, die erstmals in Stratix 10 zum Einsatz kommt. In EMIB wird der Core-Die im 14-nm-Prozess von Intel und die Transceiver im 16-nm-Prozess von TSMC erstellt.
Insgesamt sagte McNamara, dass in mehreren Bereichen mehr FPGAs mit solchen Verpackungen zum Einsatz kommen. Er sprach über Hyper-Scale-Websites, bei denen sich die Nachfrage schnell ändert und bei denen eine FPGA / CPU-Kombination in Bereichen wie Suche, Analyse und Video-Streaming sowie bei der Netzwerktransformation, wo Trends wie softwaredefiniertes Networking auftreten können, gut funktioniert und die Virtualisierung von Netzwerkfunktionen treibt den Bedarf an mehr Paketverarbeitung voran. Weitere Schwerpunkte sind 5G- und Wireless-Anwendungen, autonomes Fahren und Anwendungen für künstliche Intelligenz (KI). In AI sagte McNamara, dass optimierte ASICs und rohe Computerleistung gut für das Training geeignet sind (Intel hat Nervana gekauft), aber die FPGAs lassen sich aufgrund ihrer Flexibilität und geringen Latenz am besten ableiten, und stellte fest, dass ZTE Arria 10s verwendet hat zeigen sehr beeindruckende Bilderkennungsergebnisse.
Persönlich bin ich gespannt, ob zukünftige CPUs wirklich unterschiedliche Komponenten verwenden und diese mithilfe von EMIB oder einer ähnlichen Technologie mischen und aufeinander abstimmen, um das zu ändern, was wir als Prozessorchip betrachten. Ich bin fasziniert von der Idee, dass Systeme der Zukunft viele verschiedene Kerne verwenden können - einige programmierbare (FPGA) und andere feste (eine Mischung aus benutzerdefinierten ASICs und traditionellen CPUs und GPUs), um gemeinsam Dinge zu erreichen, die die einzelnen verbessern Technologie kann von selbst tun.