Logo von heise online

Suche
24

ISSCC: CPU-Caches lernen Platz und Strom zu sparen [Update]

Einen Teil ihrer Rechenleistung ziehen moderne Prozessorarchitekturen aus ihrem integrierten und sehr schnellen Pufferspeicher. Diese Caches bestehen fast immer aus SRAM-Zellen, die jeweils aus sechs Transistoren aufgebaut sind (6T-SRAM). Der Flächenbedarf von 6T-SRAM ist recht hoch, die "On-Die"-Caches okkupieren mittlerweile einen erheblichen, manchmal sogar den größten Teil der gesamten Siliziumfläche aktueller Prozessoren. Deshalb tragen Caches ganz wesentlich zu den Energieverlusten und Kosten des Prozessors bei.

Anzeige

Den Flächenbedarf wollen IBM-Entwickler durch die Verwendung von besonders schnellem "eingebettetem" DRAM (eDRAM) mindern. DRAM benötigt nur einen Transistor, einen Speicherkondensator und deshalb weniger Fläche als 6T-SRAM; die kleinste bisher vorgestellte 6T-SRAM-Zelle in 45-nm-Technik soll 0,248 Quadratmikrometer groß sein, doch wenn es auf besonders geringe Leckleistung ankommt, wächst der Platzbedarf deutlich.

In der ab 2008 erwarteten 45-Nanometer-SOI-Fertigungstechnik will IBM eDRAM-Zellen realisieren, die sich mit einer Random-Zugriffszeit von 1,5 Nanosekunden auch als SRAM-Ersatz eignen sollen. Typische 6T-SRAMs liefern laut IBM Daten innerhalb von 0,8 bis 1 ns, während konventionelles DRAM bestenfalls 10 ns erreicht.

[Update:] Laut IBM misst eine 45-nm-eDRAM-Zelle lediglich etwa 0,13 Quadratmikrometer und benötigt deutlich weniger Energie als eine 6T-SRAM-Zelle, nämlich bei Zugriffen lediglich etwa 80 Prozent und im Ruhezustand nur etwa 20 Prozent. Man erwarte, künftig die Größe der Caches um den Faktor drei bis vier steigern zu können. Für die jeweils 4 MByte großen L3-Caches der speziellen PowerPC-440-Prozessoren im Superrechner BlueGene/L hat IBM bereits eDRAM in Kleinserie und 130-nm-Technik gefertigt. Das 45-nm-eDRAM soll aber auch schnell genug sein, um als L1-Cache zu arbeiten.

Schon jetzt gibt es Server-Prozessoren mit bis zu 24 MByte L3-Cache (Itanium 2). Der Power6-Doppelkern soll 8 MByte On-Die-Cache haben, kommt aber wohl wie seine Vorgänger auch auf Multi-Chip-Modulen mit zusätzlichem Cache zum Einsatz.

Die Idee, eDRAM statt SRAM als Cache zu verwenden, ist alles andere als neu: so genanntes 1T-SRAM ist schon seit Jahren im Einsatz. AMD experimentiert mit Z-RAM, Intel mit Floating Body Cells, T-RAM kommt bei DRAM ohne Kondensator aus.

Intel stellt auf der ISSCC eine besonders sparsame 6T-SRAM-Bauform für den Cache von Mobilprozessoren vor. Diese wahrscheinlich im Ultra-Low-Power-65-nm-Prozess P1265 gefertigten Zellen sollen mit 0,667 Quadratmikrometern zwar größer sein als bei Intels gewöhnlichen 65-nm-SRAM-Caches (0,57 Quadratmikrometer), aber bei 0,5 Volt Spannung ihre Daten erhalten können und dabei lediglich 12 Mikroampere Leckstrom pro Megabit durchlassen. Bei 1,2 Volt sind die Sparzellen laut Intel für 1,2 GHz gut – keine Rekordwerte, aber vielleicht genug für die versprochenen UMPC-Prozessoren und ein Schritt weiter auf dem Weg, x86-Technik bis in Handys zu treiben. Stromspar-Zusatztricks wie Schlaftransistoren (das Abschalten der Stromversorgung von unbenutzten Funktionsblöcken, also "Power Gating") sowie Clock Gating (das Aussetzen der Taktfrequenz an Funktionsblöcken) kommen ja bereits seit einiger Zeit zum Einsatz.

Das Wachstum der Caches macht den Chip-Designern aber nicht nur Schwierigkeiten durch den Platz- und Strombedarf, sondern bringt auch neue, geradezu esoterische Probleme: Das tatsächliche Verhalten der riesigen SRAM-Felder auf den fertigen Chips lässt sich mit den bisherigen Entwicklungs-Tools immer schlechter vorhersagen. Diese "SRAM Variability", so befürchten manche Forscher, könnte den Fortschritt der Chip-Technik empfindlich bremsen.

Zur ISSCC 2007 siehe auch:

(Erich Bonnert) / (Erich Bonnert) / (ciw)

24 Kommentare

  1. Intel: Wir haben den kleinsten (Transistor)

    Intel 14 nm SRAM-Zelle

    Kurz nachdem Samsung den Start der Serienproduktion von 14-Nanometer-Chips gemeldet hat, betont Intel die Vorzüge der eigenen 14-nm-Transistoren.

  2. Kompakte Rechner zum Spielen und Arbeiten

    Die Palette der Mini-PCs auf der CeBIT reicht von kompakten Kraftzwergen mit Quad-Cores und leistungsfähigen Grafikeinheiten bis zu lüfterlosen Modellen für den harten Industrieeinsatz.

  3. 36-Kern-Prozessor mit effizientem Interconnect

    Mit wachsender Anzahl der CPU-Kerne wächst auch der Aufwand, deren Arbeit zu koordinieren; ein MIT-Forscherteam sucht mit Scorpio bessere Lösungen für diese Aufgabe.

  1. Prozessorgeflüster

    Die International Solid-State Circuits Conference (ISSCC) in San Francisco glänzte aus Prozessorsicht diesmal weitgehend mit Aufgüssen der Hotchips- Konferenz vom August 2012, aber hier und da auch mit ein paar Neuigkeiten.

  2. Prozessorgeflüster

    Anfang Dezember findet traditionell das International Electron Devices Meeting IEDM statt, bei dem neben der Vorstellung neuer Designs (mit und ohne Silizium) auch immer ein Überblick über die neueste Prozesstechnologie auf der Tagesordnung steht.

  3. Prozessorgeflüster

    AMD verschiebt Kaveri, IBM startet Serverattacke gegen Intel und Intel stellt AVX512 vor.

  1. Kosmische Strahlung könnte Gehirn von Astronauten schaden

    Kosmische Strahlung könnte Gehirn von Astronauten schaden

    Eine bemannte Mars-Mission dauert Jahre: Welche gesundheitlichen Auswirkungen solch ein langer Aufenthalt im All hat, ist unklar. Eine Studie zeigt nun, welche Schäden das Gehirn dabei erleiden könnte.

  2. Know-how Farben (Teil 1): Das bewirken Farbprofile

    Know-how: Das bewirken Farbprofile (Teil 1)

    RGB-Bilder brauchen Farbprofile, wenn sie „farbrichtig“ angezeigt oder ausgedruckt werden sollen. Doch was sind und wie wirken solche Profile eigentlich? Diese und andere Fragen beantworten wir in einer kleinen Artikelserie, und machen dabei auch ab und zu einen Abstecher vom Farb- in den Weltraum.

  3. Raumangebote

    Seat Alhambra

    Volkswagen hat seine beiden größten Vans leicht überarbeitet. Technisch tat sich dabei mehr als optisch, was nicht weiter verwunderlich ist, denn beide verkaufen sich noch sehr gut, obwohl sie schon fünf Jahre auf dem Markt sind

  4. c't uplink 6.4: WhatsApp-Hacks, Notebook-Test, BIOS- und UEFI-Angriffe

    c't uplink 6.4

    In der aktuellen Folge c't uplink nehmen wir WhatsApp auseinander, testen 12-Zoll-Notebooks inklusive neuem Macbook und begeben uns auf die Spuren von BIOS- und UEFI-Hackern.

Anzeige