Video: 36C3 - Intel Management Engine deep dive (November 2024)
Auf dem Intel Developer Forum in dieser Woche hat der Prozessorhersteller erstmals Einzelheiten zum Innenleben seiner Skylake-Mikroarchitektur bekannt gegeben, die als Core-Prozessoren der sechsten Generation verkauft wird.
Skylake ist erst am Anfang der Markteinführung - die freigeschalteten "K" -Versionen für Overclocker wurden vor ein paar Wochen auf der Gamescon angekündigt, aber der Hauptstart der breiten Palette an Chips scheint nun für den 1. September geplant zu sein Ich habe nicht öffentlich darüber gesprochen, welche spezifischen Teile es enthüllen wird, außer um vorzuschlagen, dass es sich um eine sehr breite Produktpalette handelt.
In der Tat war dies der größte Punkt, den Julius Mandelblat, leitender Prinzipalingenieur und Hauptverantwortlicher von Skylake, bei der Beschreibung der Architektur im Forum anstrebte. Als das Team vor fünf Jahren mit der Arbeit an dem Projekt begann, war geplant, eine traditionelle Client-Architektur zu erstellen, die von sogenannten "schlanken und leichten" Notebooks bis hin zu Desktops einen Leistungsbedarf von etwa dem 3-fachen umfasst. Dann kam der Drang nach Ultrabooks, die noch dünner sind, vor Notebooks und Tablets mit noch geringerer Leistung. Das Endprodukt muss eine Leistung von 20X unterstützen, beginnend bei 4, 5 Watt (für die M-Serie, die in lüfterlosen Notebooks, Tablets und 2-in-1-Geräten verwendet wird) bis zu 91 Watt in der Basiskonfiguration des Top-K-Desktops Produkte.
Der Einstieg in neue Formfaktoren erfordere einen hohen Fokus auf Energieeffizienz, so Mandelblat. Das endgültige System-on-Chip-System (SoC) könnte also 40 bis 60 Prozent weniger Strom verbrauchen, zum Beispiel für die Videowiedergabe und -konferenz sowie für den Leerlauf. Außerdem könnte der IO-Chipsatz erweitert werden, um die neuen Geräte zu unterstützen, insbesondere um ein Image hinzuzufügen einzelner Prozessor.
In den Kommentaren nach der Präsentation machte Mandelblat deutlich, dass der Schwerpunkt auf der Leistung pro Watt und nicht auf der Rohleistung lag. Als ich ihn nach der relativ geringen Leistungssteigerung fragte, die für die Skylake K-Serie im Vergleich zu früheren Haswell-Serien gemeldet wurde, sagte Patrick Casselman, Senior Platform Market Manager, wir sollten heute kein Urteil fällen. "Warten Sie, bis Sie die mobilen Produkte sehen", sagte er und schlug vor, dass wir dort eine viel bessere Leistung sehen werden. Nach dem Vortrag sagte Mandelblat, dass man sich darauf konzentrieren müsse, um eine große Leistungsverbesserung bei Desktop-Komponenten zu erzielen, da eine Reihe von Systemänderungen erforderlich sind. Dabei ist zu beachten, dass es derzeit keinen einzigen Engpass gibt, sondern eine ausgeglichene Leistung.
Es ist sinnvoll, dass Intel sich auf die Entwicklung von Teilen für eine breite Palette von Geräten konzentriert, anstatt auf die reine Desktop-Leistung, aber es ist eine große Veränderung gegenüber dem Ziel, das Mikroprozessordesign vor nicht allzu langer Zeit zu verfolgen.
In der Präsentation ging Mandelblat detaillierter auf das Design der Mikroarchitektur ein und zeigte ein grundlegendes Diagramm der Änderungen in der Architektur (siehe oben in diesem Beitrag). Dabei stellte er jedoch fest, dass nicht jeder auf Skylake basierende Teil alle diese Funktionen aufweist. Zu den größten Änderungen gehörten eine verbesserte Ringverbindung zwischen den CPU-Kernen, ein integrierter Bildsignalprozessor (ISP) für die Kameraunterstützung, verbesserte Grafiken, einige neue Sicherheitsfunktionen und mehr Fokus auf die Ermöglichung des Übertaktens.
Für die traditionellen x86-CPU-Kerne (die er als IA-Kerne bezeichnete) sagte Mandelblat, eine der großen Änderungen sei die "Konfigurierbarkeit" mit verschiedenen Kernkonfigurationen für Server im Vergleich zu Clients. Viele Serverfunktionen kommen dem Client nicht zugute. Auf der Clientseite umfassen die Kerne ein verbessertes Front-End mit verbesserter Verzweigungsvorhersage, tieferen Puffern außerhalb der Reihenfolge, verbesserten Ausführungseinheiten und einem erweiterten Speichersubsystem, mit dem die Kerne mehr Bandbreite aus den Speichercaches abrufen können.
Besonders hervorzuheben ist die Leistungsoptimierung, die das Herunterfahren von Teilen des Prozessors ermöglicht, wenn diese nicht verwendet werden - insbesondere der AVX-Erweiterungen - und insbesondere die Fähigkeit, Videowiedergabe und Multimedia mit viel weniger Leistung zu betreiben. Er sagte, dass es eine große Verbesserung im Leerlaufstromverbrauch gab.
Außerhalb der Kerne enthält das Produkt neue Cache- und Speicherlösungen. Er merkte an, dass seit der Einführung der Ringarchitektur vor einigen Jahren eine große Veränderung darin besteht, dass jetzt ein größerer Teil der Bandbreite von Dingen außerhalb der Kerne verbraucht wird, insbesondere auch vom Grafik-Subsystem. Dies hat eine neue eingebettete DRAM-Cache-Architektur (die normalerweise in den Versionen mit Iris Pro-Grafiken verwendet wird), die jetzt als speicherseitiger Cache verwendet werden kann. Die Architektur ist jetzt so konzipiert, dass Dinge wie Anzeige und Bildsignalverarbeitung eine konsistentere Servicequalität bieten können.
"In diesem Projekt ging es viel um Energie", sagte Mandelblat und merkte an, dass die Mikroarchitektur in jedem Block und jeder Verbindung eine Energieoptimierung beinhaltete. Beispielsweise könnte die Bildschirmauflösung bei einer Leistungssteigerung von nur 20 Prozent um 60 Prozent gesteigert werden, was eine bessere Nutzung von hochauflösenden Bildschirmen ermöglicht. Wenn Sie in einem Teil des Würfels Strom sparen, können Sie ihn in einem anderen Teil verwenden. Dies würde einen besonderen Leistungsunterschied bei lüfterlosen Designs bedeuten, bei denen weniger Leistung in Teilen des Chips, die nicht verwendet werden, mehr Leistung für die CPU oder die Grafikkerne ermöglicht.
Eine der größten Änderungen ist die Integration eines Bildsignalprozessors und der Unterstützung für Kameras direkt im SoC selbst, anstatt sich auf einen separaten ISP-Chip zu verlassen. Während dies bei einer Reihe von mobilen Prozessoren üblich ist, ist dies das erste Mal, dass Intel die Integration vornimmt. Dies sei für kleinere Formfaktoren erforderlich, sagte Mandelblat, da dadurch ein zusätzlicher Kameraprozessor entfällt, die Stückliste reduziert und eine bessere Energieoptimierung ermöglicht wird, da das System sie neben den anderen Funktionen verwalten kann.
Skylake unterstützt bis zu vier Kameras - zwei gleichzeitig - und ermöglicht selbst- und weltgerichtete Kameras mit bis zu 13-MP-Sensoren. Es unterstützt Funktionen wie 1080p-Video mit 60 Bildern pro Sekunde oder 2.160 (4K) -Video mit 30 Bildern pro Sekunde sowie Smile-Shutter, Burst-Capture, HDR und die Aufnahme von Standbildern mit voller Auflösung während der Videoaufnahme. Das sollte für den Tablet-Markt gut sein, aber beachten Sie, dass die mobilen Prozessoren der Spitzenklasse jetzt auch Kameras mit höherer Auflösung unterstützen können.
Andere Änderungen umfassen eine Reihe von Sicherheitsverbesserungen. Zu den wichtigsten zählen Software Guard Extensions (SGX), eine Reihe von Anweisungen für eine Anwendung zum Starten einer vertrauenswürdigen Ausführungsumgebung, die als Enklave bezeichnet wird. Auf diese Weise kann die Anwendung Code oder Daten vor dem Rest des Prozessors geheim halten und so viele hardwarebasierte Angriffe verhindern. Die Architektur verfügt auch über eine Funktion namens Memory Protection Extensions (MPX), die die Speichergrenze vor dem Zugriff testet und so sicherstellt, dass der Zugriff in den für den Prozess zugewiesenen Speicher fällt, wodurch eine der häufigsten Arten von Angriffen beseitigt wird.
Weitere Änderungen betreffen eine höhere Energieeffizienz des Chipsatzes und die Unterstützung von PCI Express 3.0, einen stärkeren E / A-Fokus (insbesondere für mobile Versionen) und schnellere E / A-Vorgänge. Es gibt auch ein verbessertes Audio und einen integrierten Sensor-Hub.
Der Chip wurde für das Übertakten entwickelt, wie in den K-Versionen zu sehen, wobei er bis zu 83 Schritte in Schritten von 100 MHz mit einem theoretischen Maximum von 8, 3 GHz unterstützt (und bereits einige Demonstrationen bei 7 GHz mit Flüssigstickstoffkühlung).
In einer separaten Präsentation zu Skylake-Grafiken von David Blythe, Intel Fellow und Director of Graphics Architecture, wurde das Gen9-Grafiksubsystem von Intel beschrieben.
Er sprach darüber, wie sich die Grafikleistung in den letzten sechs Jahren bei Core-Designs von der Unterstützung von bis zu 10 Ausführungseinheiten (EUs) mit 43 Gigaflops Leistung bei den ursprünglichen Core-Designs auf bis zu 48 Ausführungseinheiten und 768 Gigaflops auf die höchsten dramatisch erhöht hat Ende der Broadwell-Chips. Mit Skylake brauche es einen weiteren Sprung, der bis zu 72 EUs und 1152 Gigaflops erlaube. (Hinweis: Intel bietet in der Regel eine Vielzahl von Versionen mit unterschiedlich vielen Grafiken an.) Er sagte, die Gesamtleistung bei Grafiken sei in diesem Zeitraum auf der Grundlage von 3DMark-Ergebnissen über 100-mal höher.
Zusätzlich zu nur mehr EUs gibt es Verbesserungen bei den verschiedenen Verwendungsmöglichkeiten, einzeln und als "Slices" - es werden 24 EUs eingerichtet. Es wird verschiedene Versionen mit unterschiedlicher Anzahl von EUs geben. Insbesondere wird GT2 einen Slice (und damit 24 EUs) verwenden, GT3 wird zwei Slices (48 EUs) verwenden und der neue GT4 wird drei (72 EUs) verwenden. Blythe sagte, es gebe große Durchsatzsteigerungen pro Slice sowie mehr Slices am oberen Ende, mit der Fähigkeit, das untere Ende zu verkleinern.
Skylake unterstützt auch neuere APIs, einschließlich Microsoft DirectX 12, Open CL 2.0 und Open GL 4.4. Dank der Unterstützung von HEVC-, VP8- und MJPEG-Video, einem neuen schnellen Synchronisationsvideomodus für Echtzeitanwendungen mit geringem Stromverbrauch wie Videokonferenzen und neuen RAW-Bildgebungsfunktionen wurden auch die Medienfunktionen verbessert.