Video: Самые мощные процессоры для работы и игр представлены официально (November 2024)
In einer Reihe jüngster Ankündigungen haben Intel und AMD einige wichtige Änderungen in der Architektur ihrer x86-Prozessoren separat vorgestellt, die versprechen, die Art und Weise, wie x86-Prozessoren in den nächsten Jahren eingesetzt werden, zu verändern.
Letzte Woche kündigte AMD eine neue Speicherarchitektur an, die darauf abzielt, CPU- und GPU-Computing enger zusammenzuführen. Intel legte einen neuen Schwerpunkt auf die Verbesserung seiner Position bei traditionelleren PC-Grafiken. Gestern kündigte Intel eine komplett neue Version der Mikroarchitektur für die Atom-Prozessorserie an, die diese Chips deutlich leistungsfähiger machen und möglicherweise die Lücke zwischen Atom und der Mainstream-Core-Prozessorfamilie des Unternehmens schließen soll.
AMDs neue Speicherarchitektur
Die Ankündigung des so genannten heterogenen einheitlichen Speicherzugriffs (HUMA) durch AMD war keine große Überraschung, da sich das Unternehmen seit langem mit der heterogenen Systemarchitektur (HSA) befasst.
Das Konzept ist ziemlich einfach. Selbst bei einem Chip, bei dem sich sowohl die CPU als auch die Grafikverarbeitung (GPU) auf demselben Chip befinden, wie bei den APUs (Accelerated Processing Units) von AMD, sind der von der CPU und der Grafik verwendete Speicher in getrennten Pools geblieben. Während sich physisch derselbe Speicher befindet, verwenden die CPU und die GPU unterschiedliche Zeiger auf den Speicher. Um die GPU zum Rechnen zu verwenden, muss ein Programm die Daten aus dem von der CPU verwendeten Teil des Speichers in den von der Grafik verwendeten Teil kopieren, die Berechnung durchführen und erneut kopieren. All dies braucht Zeit. Bei einem wirklich einheitlichen Speichersystem, das Grafiken enthält, ist dies nicht erforderlich.
AMD treibt dies im Rahmen der HSA-Stiftung voran, zu der ARM, Qualcomm, Samsung, Texas Instruments, MediaTek und Imagination gehören. Insbesondere verwendet dieser Ansatz eine als HSAIL bekannte Softwarelaufzeit und eine Reihe von Schnittstellen für HSA-beschleunigte Anwendungen.
In dieser Woche hat AMD ausführlich erläutert, wie CPU und GPU in ihrer HUMA-Architektur Speicher aus dem gesamten Speicherbereich dynamisch zuordnen und zusammen mit demselben virtuellen Adressierungsschema verwenden können. Der Speicher ist bidirektional kohärent, so dass jede Aktualisierung des Speichers durch die CPU oder GPU von den anderen Verarbeitungselementen gesehen wird. Die GPU unterstützt jetzt seitenweise verfügbaren Speicher mit virtuellen Seiten, sodass sie mit größeren Datenmengen (wie CPUs derzeit arbeiten) arbeiten kann. Die Idee ist, dass CPU und GPU effizienter zusammenarbeiten können. Laut AMD können Entwickler HSA-beschleunigte Anwendungen mit Standard-Programmiersprachen wie Python, C ++ und Java schreiben.
AMD ist nicht das einzige Unternehmen, das heterogenes Computing als wichtig ansieht, und die HSA Foundation hat auch ihre Konkurrenten. Nvidia war ein großer Befürworter dessen, was es früher als GP-GPU bezeichnete. Es hat seine CUDA-APIs weiterentwickelt und versprochen, dass eine zukünftige Version seiner Grafikprozessoren Unified Memory unterstützen wird. Einige der großen Softwareplattformen haben ihre eigenen Alternativen: die DirectCompute-Erweiterungen von Microsoft für DirectX für GP-GPU-Computing und die Renderscript-API von Google für heterogenes Computing. Am wichtigsten ist vielleicht, dass die Khronos Group, ein Industriekonsortium, den OpenCL-Standard fördert.
Die große Frage wird sein, welche dieser Standards Entwickler anziehen werden. AMDs erster Prozessor, der hUMA unterstützt, wird der Kaveri-Prozessor sein, der voraussichtlich Ende 2013 ausgeliefert wird (allerdings erst Anfang nächsten Jahres in Systemen). AMD liefert auch die APU für die PlayStation 4 und es wird allgemein gemunkelt, dass AMD die APU auch für die Xbox der nächsten Generation liefert. Es ist wahrscheinlich, dass auch andere Mitglieder der HSA Foundation die hUMA-Architektur verwenden könnten, obwohl noch keiner solche Entwürfe angekündigt hat. Zusammen könnte dies ausreichen, um eine kritische Masse für Entwickler und Tools zu schaffen, und wenn ja, könnte sich dies als sehr wichtig herausstellen.
Intel verdoppelt Grafik für Haswell
Ende letzter Woche enthüllte Intel weitere Details zu seinem kommenden Core-Prozessor der 4. Generation, einem 22-nm-Produkt namens Haswell. Intel hatte zuvor eine Reihe neuer Funktionen für Haswell veröffentlicht, darunter neue AVX2-Anweisungen für die Arbeit mit größeren Ganzzahlvektoren und FMA-Anweisungen (Fused Multiply Add) für Gleitkommazahlen. Dies sind Dinge, die Endbenutzer wahrscheinlich nicht sehen werden, außer im Hinblick auf eine verbesserte Leistung bei eher spezialisierten Workloads.
Das Interessanteste an der neuen Ankündigung ist der Fokus auf Grafik, ein Bereich, in dem die Konkurrenten AMD und Nvidia mit Sicherheit einen Vorsprung hatten.
Intel unternimmt jedoch einige große Schritte mit den Haswell-Prozessoren. Intel hat seit langem angekündigt, dass einige Modelle von Haswell mehr Grafiken erhalten werden, darunter eine High-End-Version namens GT3. Tatsächlich handelt es sich lediglich um zusätzliche Grafikanweisungseinheiten, die über den Beträgen der aktuellen Ivy Bridge-Prozessoren liegen. Für sich genommen ist dies eine große Veränderung, da Intel bei seinen Produkten in der Regel mehr Platz für die CPU zur Verfügung stellt, während die konkurrierenden APUs von AMD mehr Platz für die Grafik zur Verfügung stellen.
Intel hat kürzlich eine andere Variante vorgestellt, die GT3e-Grafik, die dem Paket mit dem Haswell-Chip einen zweiten Chip mit 128 MB eingebettetem DRAM hinzufügt und die Grafikleistung beschleunigen soll. Letzte Woche kündigte Intel an, dass die schnelleren Versionen der GT3-Grafik nun Iris heißen und die mit dem eingebetteten DRAM Iris Pro, da Intel einen gewissen Branding-Vorteil der neuen Grafikebenen erzielen möchte.
Insbesondere wird die Haswell-Linie in Versionen mit einer geringen Anzahl von Grafiken (GT1) unterteilt, die als HD-Grafiken bezeichnet werden. mit der GT2-Grafik (entspricht dem High-End der Ivy Bridge-Linie) mit der Bezeichnung HD Graphics 4200 bis 4600, abhängig von der Geschwindigkeit; mit GT3-Grafik, aber mit 15 Watt, HD Graphics 5000 genannt; Teile mit GT3-Grafik mit 28 Watt und mehr werden nun als Intel Iris Graphics 5100 bezeichnet. und die mit der GT3e-Grafik und der eingebetteten Grafik namens Iris Pro 5200. (Intel war noch nie einer, um die Benennung zu vereinfachen.)
Die Teilenummern von Intel bleiben kompliziert, aber beachten Sie, dass eine Teilenummer, die mit 4 beginnt, Haswell anzeigt, während eine, die mit 3 beginnt, Ivy Bridge anzeigt. Das Unternehmen verwendet MQ, um Standardteile für GT3-Notebooks anzugeben, und HQ, um Teile mit eingebettetem DRAM anzugeben.
Als Teil der Ankündigung teilte Intel die Leistungszahlen für die neuen Teile mit und zeigte signifikante Leistungsverbesserungen im Vergleich zu den vorhandenen Prozessoren des Unternehmens. Intel gab Zahlen bekannt, die eine bis zu 1, 5-fache Ultrabook-Leistung der Vorgängergeneration bei annähernd gleichem Stromverbrauch vermuten lassen (und die doppelte Leistung mit einem Chip mit höherer Leistung für etwas größere Notebooks mit 14-Zoll- und größeren Bildschirmen), doppelt so hoch wie die Grafik Leistung auf herkömmlichen Notebooks und fast das Dreifache der Leistung auf Desktop-Systemen.
Laut Intel sind die neuen Iris- und Iris Pro-Grafiken mit diskreten GPUs vergleichbar, und das ist eine große Sache. (Wie immer nehme ich alle Leistungszahlen mit einem Körnchen Salz, bis ich die Produkte tatsächlich testen kann.) Ich bin mir sicher, dass es für Spiele- und Workstation-Anwendungen immer noch viel leistungsstärkere diskrete Desktop-Grafikteile von AMD und Nvidia geben wird, aber In der Regel verbrauchen diese Teile viel Strom. Bei Laptops in voller Größe, bei denen die Leistungshülle viel kleiner ist, ist die On-Die-Grafik wichtiger, aber es gibt immer noch einen großen Markt für diskrete Grafiken. Intel scheint auf diesen Markt abzuzielen. Ultrabooks und andere dünne Notebooks hatten normalerweise nicht die Leistungsanforderung, diskrete Grafiken auszuführen. Verbesserte On-Die-Grafiken sind daher willkommen.
Intels neue Atom-Mikroarchitektur
In vielerlei Hinsicht betraf die größte Ankündigung von Intel jedoch die stromsparende Architektur, die die Architektur der aktuellen Atom-Architektur des Unternehmens ersetzen soll. Die Atom-Familie ist vor allem für den Einsatz in Mobilgeräten wie Tablets und in geringerem Maße auch in einigen Smartphones bekannt. Die neue Architektur, die als Silvermont bekannt ist, richtet sich auch an eine Vielzahl von Rechenzentren und Embedded-Märkten.
Die Architektur stellt eine große Veränderung dar. Anstelle der in früheren Versionen der Atom-Architektur verwendeten In-Order-Ausführungs-Engine, einschließlich der Saltwell-Architektur, die in den aktuellen 32-nm-Atom-Versionen des Unternehmens verwendet wurde, fügt Silvermont eine In-Order-Ausführungs-Engine hinzu, wie sie in den Core- und Xeon-Prozessoren von Intel verwendet wird. Dies sollte die Verarbeitung von Single-Thread-Anwendungen erheblich verbessern. Es bietet eine neue System-Fabric-Architektur, die für die Skalierung von bis zu acht Kernen ausgelegt ist (am wahrscheinlichsten für Anwendungen wie Mikroserver). Schließlich werden neue Anweisungen (um sie mit denen der Westmere-Version der Core-Prozessoren gleichzusetzen) sowie neue Sicherheits- und Virtualisierungstechnologien hinzugefügt.
Die neue Architektur ist modular aufgebaut und basiert auf Modulen, die zwei Kerne, 1 MB gemeinsam genutzten L2-Cache (sehr geringe Latenz, hohe Bandbreite) und eine dedizierte Punkt-zu-Punkt-Schnittstelle zur SoC-Struktur enthalten. Beachten Sie, dass dies das Konzept des Multi-Threading ersetzt, das Intel stark gefördert hat, und in der Tat ein bisschen wie der modulare Ansatz von AMD klingt, der in den aktuellen Desktop- und Server-Chips verwendet wird. (Intel gab sich jedoch große Mühe, um zu erklären, dass dies nicht dasselbe war. Die AMD-Module teilen mehr Dinge, einschließlich Fließkommazahlen.) Die Module können zu bis zu acht Kernen kombiniert werden.
Laut Intel ermöglicht die neue Architektur einen breiteren dynamischen Leistungsbereich und ermöglicht jedem Kern ein unabhängiges Frequenz- und Energiemanagement, so dass jeder in Bezug auf Leistung und Stromverbrauch auf und ab gehen kann. (Im Gegensatz zu mobilen Prozessoren verwendet Qualcomm bei seinen Krait-Kernen mehr als die Standard-ARM big.LITTLE-Kombination.) Darüber hinaus bietet es ein verbessertes Energie-Management und einen schnelleren Ein- und Ausstieg aus dem Standby-Modus, was besonders wichtig ist auf dem Mobilfunkmarkt.
Das Unternehmen gibt an, dass die Leistung zwischen dem CPU-Kern und anderen Elementen wie Grafiken besser angepasst werden kann, was eine differenziertere Implementierung des Burst-Modus ermöglicht.
Insgesamt ist Intel der Ansicht, dass die neue Architektur und der Wechsel zum 22-nm-FinFet-SoC-Prozess des Unternehmens Chips ermöglichen sollten, die eine bis zu dreimal höhere Leistung oder eine fünfmal niedrigere Leistung als aktuelle Atom-Chips bieten. Im Allgemeinen sagte Intel, dass sein "effizienter" Dual-Core-Prozessor einen ineffizienten aktuellen Quad-Core-Prozessor unter Strombeschränkungen übertreffen kann. (Wie immer werde ich darauf warten, dass die Produkte dies beurteilen.)
Wie die aktuelle Atom-Reihe wird die Silvermont-Architektur wahrscheinlich in einer Vielzahl von Prozessoren eingesetzt, die von mobilen Geräten bis zu größeren Systemen reichen. Dazu gehören Avoton für Mikroserver, Rangely für Netzwerkgeräte, Merrifield für Smartphones und Bay Trail für Tablets und Convertibles. Das am meisten erwartete ist die 22-Seemeilen-Plattform Bay Trail, die Intel voraussichtlich rechtzeitig auf den Markt bringen wird, damit Tablets in der Weihnachtszeit verfügbar sind. Weitere Einzelheiten folgen in Kürze.
Insgesamt klingt die Silvermont-Architektur wie ein großer Fortschritt gegenüber der vorhandenen Atom-Architektur, und ich bin besonders gespannt, wie Bay Trail, basierend auf dieser Architektur, tatsächlich abschneidet. Bisher gab es eine bemerkenswerte Leistungslücke zwischen dem Low-End der Core-Familie und den High-End-Atomen, aber diese Architektur scheint die Lücke wirklich schließen zu können.
Fazit: Grafik und Power definieren den Wettbewerb
Jeder Hauptprozessor, den Sie heute sehen - ob ein Intel- oder AMD-Chip für Desktops oder Laptops oder ein ARM-basierter Chip für Smartphones und Tablets - verfügt über mehrere CPU-Kerne, in der Regel mehrere GPU-Kerne (mit Ausnahme von Server-Chips) und alle möglichen andere spezialisierte Logik für Dinge wie Bildverarbeitung, Videocodierung und -decodierung und Verschlüsselung.
Wenn der Chipprozess kleiner wird, können mehr Transistoren auf einem einzelnen Chip enthalten sein. Welche Funktionen zu integrieren sind (und wie diese zu integrieren sind), ist nach wie vor ein entscheidendes Unterscheidungsmerkmal unter den Chipanbietern, ebenso wie das spezifische Design und die Mikroarchitektur der Chips.
Diese Ankündigungen zeigen die Kompromisse, die Intel und AMD eingehen, und diese dürften in den nächsten Jahren enorme Auswirkungen auf die Datenverarbeitung haben.
Bei Desktops und Laptops scheint Intel nicht nur zu versuchen, mit der integrierten Grafikleistung mit AMD Schritt zu halten, indem weitere Ausführungseinheiten hinzugefügt werden, sondern auch Funktionen wie eingebettetes DRAM, das die Prozesstechnologie nutzt führen. AMD wird auch mit seiner Grafik nicht still sitzen, daher sollte es ein interessantes Matchup geben. In der Zwischenzeit bemüht sich AMD, die Grafik- und CPU-Funktionen besser zu integrieren, was zu einer neuen Art der Programmierung führen könnte. das dauert länger, könnte sich aber als unglaublich wichtig herausstellen.
Der Kampf zwischen AMDs Kaveri und Intels Haswell könnte daher interessanter sein als der Intel-AMD-Wettbewerb der letzten Jahre. Haswell wird sicherlich zuerst versenden. (Ich gehe davon aus, dass Kaveri im Sommer und Anfang nächsten Jahres Systeme einsetzen wird.) Auch dies gilt hauptsächlich für Mainstream-Desktops und -Notebooks. Spieler und Workstation-Benutzer werden nach wie vor zweifellos beide Chips mit diskreten Grafiklösungen von AMD oder Nvidia kombinieren wollen.
Für Tablets und möglicherweise auch Telefone könnte sich der Ansatz der heterogenen Systemarchitektur, den AMD und andere forcieren, als noch wichtiger herausstellen, auch wenn es noch eine Weile dauern wird, bis sich herausstellt, ob Anwendungen wirklich davon profitieren. Die neue Architektur von Intel soll die Wettbewerbsfähigkeit in diesem Bereich erhöhen. Es sieht wirklich nach einem großen Schritt nach vorne aus, aber auch die Konkurrenten werden in Bewegung bleiben.
Ich bin ein bisschen neugierig, ob Dinge wie die auf Silvermont basierende Bay Trail-Plattform für Atom tatsächlich so schnell laufen, dass sie in mehr Mainstream-Low-End-Notebooks oder sogar auf Desktops zu finden sind. Bereits die heutigen Atom-basierten Tablets laufen unter Windows recht gut, und mit den Verbesserungen könnte dies für viele Mainstream-Benutzer ausreichen, selbst wenn es hinter der Leistung von Haswell oder Kaveri (oder Intels aktuellem Sandy Bridge und AMDs aktuellem Richmond) zurückbleibt Angelegenheit).
Es soll im kommenden Jahr ein spannender Wettbewerb werden.