POWER8 | |
Gyártás | 2013 |
Tervező | IBM |
Max CPU órajel | 2,5 GHz – 5 GHz |
Gyártás technológia méret | 22 nm |
Architektúra | Power Architektúra (Power ISA v.2.07) |
Magok száma | 4, 6, 8, 10 vagy 12 |
L1 gyorsítótár | 64+32 KiB magonként |
L2 gyorsítótár | 512 KiB / minicsip |
L3 gyorsítótár | 8 MiB / minicsip |
L4 gyorsítótár | 16 MiB egy Centaur-ban |
Előd | POWER7 |
Utód | POWER9 |
A Wikimédia Commons tartalmaz POWER8 témájú médiaállományokat. |
Power Architektúra |
---|
NXP (volt Freescale és Motorola) |
PowerPC e sorozat (2006) (
e200
• e300
• e500
• e600
• e5500
• e6500 )
|
IBM |
POWER ISA (1990)
• POWER sorozat (1990)
|
IBM-Nintendo együttműködés |
Egyéb |
Titan • PWRficient • Cell • Xenon • X704 |
Kapcsolódó hivatkozások |
OpenPOWER Alapítvány
• AIM alliance
• RISC
• Blue Gene
• Power.org
• PAPR
• PReP
• CHRP
• AltiVec
• tovább...
|
A POWER8 egy a Power Architektúrán alapuló szuperskalár szimmetrikus multiprocesszor-család. 2013 augusztusában volt bemutatva a Hot Chips konferencián. A tervei licencelhetőek az OpenPOWER Foundation alapítványon keresztül; ez az első alkalom, hogy az IBM legnagyobb teljesítményű csúcskategóriás processzorai ilyen licenc-konstrukcióban vesznek részt.[1][2]
A POWER8 alapú rendszerek az IBM-től 2014 júniusában kezdtek megjelenni.[3] Az IBM-es Ken King, az OpenPOWER Alliances általános igazgatója szerint más OpenPOWER tagok által gyártott rendszerek és POWER8 processzor-kialakítások 2015 elején fognak megjelenni,[4] de úgy néz ki, hogy a TYAN cég ennél korábban, már 2014 októberében kész ilyen rendszereket szállítani.[5]
A POWER8-at egy igen nagymértékben sokszálas végrehajtású csipnek tervezték: a benne lévő minden egyes mag nyolc hardveres szálat képes egyidejűleg kezelni, így egy 12 magos csip összesen 96 szálat képes egyidejűleg végrehajtani. A processzor erőteljesen kihasználja a nagyon nagy méretű csipre épített és csipen kívüli eDRAM gyorsítótárakat, és a lapkára integrált memóriavezérlők igen magas sávszélességét a memória és a rendszer be-/kimeneti funkciói számára. A legtöbb munkafeladat végrehajtásában a csip kétszer-háromszor olyan gyors, mint elődje, a POWER7.[6]
Míg a megelőző POWER processzoroknál a GX++ sín szolgált a külső kommunikációra, a POWER8-nál ezt a sínt kivették a tervekből és funkcióját a CAPI porttal (Coherent Accelerator Processor Interface) váltották fel, ami a PCI Express 3.0 fölötti kommunikációs réteg. A CAPI port specializált kisegítő processzorok kapcsolására használatos, mint például a GPU-k, ASIC-ek és FPGA-k.[7][8]
A CAPI sínhez kapcsolt egységek ugyanazt a memória-címterületet tudják használni, mint a CPU, ezáltal csökkenhet a számítási úthossz. A 2013. évi ACM/IEEE Szuperszámítógépes Konferencián (ACM/IEEE Supercomputing Conference) az IBM és Nvidia bejelentett egy műszaki együttműködést, amely a POWER8 és az Nvidia GPU-k szoros összepárosítását célozza a jövőbeli HPC rendszerekben,[9] amelyek közül az első bejelentett modell a Power Systems S824L.[10]
A POWER8 tartalmaz egy úgynevezett lapkára integrált vezérlőt (OCC) is, ami egy egy PowerPC 405 processzoron alapuló teljesítmény- és hőmérséklet-szabályozó mikrovezérlő. Ennek van két általános célú „feladatátvevő egysége” (offload engine, GPE, kisebb feladatokat végrehajtó tehermentesító-gyorsító egység) és 512 KiB beágyazott statikus RAM-ja, amely azzal együtt, hogy közvetlenül eléri a főmemóriát, képes egy nyílt forráskódú firmware futtatására is. Az OCC igazgatja a POWER8 működési frekvenciáját, feszültségét, memória sávszélesség, és hőmérséklet-vezérlését a processzor és memória számára egyaránt; működés közben képes szabályozni a feszültségeket 1764 integrált feszültségszabályozón (IVR) keresztül. Továbbá, az OCC programozható a POWER8 processzor órajelének túlhajtására (overclock), vagy az energiafelhasználás csökkentésére az üzemfrekvencia csökkentésével (ez hasonlít a néhány Intel és AMD processzorban található konfigurálható TDP-re).[11][12][13][14]
A POWER8 4-, 6-, 8-, 10- és 12 magos változatokban jelenik meg;[15][16] mindegyik változatot 22 nm-es szilícium szigetelőn (silicon on insulator, SOI) típusú, 15 fémrétegű folyamattal gyártják. A 12 magos verzió 4,2 milliárd tranzisztorból áll[17] és 650 mm² felületű (kb. 25,5×25,5 mm), míg a 6 magos verzió felülete csak 362 mm².[3]
A POWER8 csipek memóriavezérlői DDR3 vagy DDR4 memóriákat is használhatnak, de érdekes módon jövő-állónak tervezték őket, mivel ezek olyan általános (nem specifikus) memóriavezérlők, amelyek egy Centaur-nak elnevezett külső komponenssel párosíthatóak, ami memóriapuffer, L4 gyorsítótár-csip és tényleges memóriavezérlő egyben. A jelenlegi Centaur csip még DDR3 memóriát használ, de egy jövőbeli verzió már DDR4-et használhat vagy valamilyen más memória-technológiát, anélkül, hogy ehhez a POWER8 csipet meg kéne változtatni.
A POWER8 csip és a Centaur közötti összeköttetések mindegyike 9,6 GiB/s sebességű, 40 ns késleltetéssel. A Centaur 16 MiB eDRAM-ot tartalmaz, amit a processzor L4 gyorsítótárként használhat. Minden POWER8 max. nyolc Centaur csiphez kapcsolódhat, ami legfeljebb 1 TiB memóriát jelenthet foglalatonként, az aggregált 128 MiB L4 gyorsítótárakkal, ekkor az elérhető folyamatosan fenntartható memória sávszélesség 230 GiB/s, mind a processzor felé bemenő, mind a kimenő irányba, összesen 32 DRAM porttal és 410 GiB/s csúcs memória-sávszélességgel a DRAM-on. A Centaur csipek DRAM DIMM modulokba vannak szerelve.[1][18][19]
A Centaur csipeket egy a POWER8-éhoz hasonló folyamattal gyártják.
A POWER8 magnak 64 KiB L1 adat- és 32 KiB L1 utasítás-gyorsítótára van. Mindegyik mag 10 utasítás kibocsátására képes és minden ciklusban 8 utasítást továbbít a 16 végrehajtó egységnek (Execution Unit, EU), amik a következők: 2 fixpontos egység (Fixed-Point Unit, FXU), 2 betöltő-tároló egység (Load-Store Unit, LSU), 2 utasítás-lehívó egység (Instruction Fetch Unit, IFU), 4 lebegőpontos egység (Floating Point Unit, FPU), 2 VMX egység, 1 kriptográfiai egység, 1 decimális lebegőpontos egység (DFU), 1 feltételregiszter-egység (Condition Register Unit, CRU) és 1 elágazási regiszter egység (Branch Register Unit, BRU).[18]
A magnak van egy nagyobb, 4×16 elemű kibocsátási sora, javított elágazás-előrejelzői és kétszer annyi találati hibát képes kezelni (mint elődje). Mindegyik mag nyolcutas, hardveresen többszálú, dinamikusan és automatikusan particionálható egy, két, négy vagy mind a nyolc szál aktív használatára.[1] A POWER8-at kiegészítették a tranzakciós memória hardveres támogatására szolgáló eszközökkel.[20][21][22] Az IBM becslései szerint minden egyes mag 1,6-szor gyorsabb a POWER7-nél az egyszálas műveletekben.
A POWER8 processzorban a magok ún. minicsipek (chiplet az IBM kifejezésével) formájában helyezkednek el a teljes csipen. A minicsipek ezen felül 4 szabályozási doménre oszlanak. A processzor 4, 6, 8, 10 vagy 12 minicsipes kialakítás lehet, a változatok igényei szerint, ezekben egy minicsip egy magot, 512 KiB SRAM-mal kialakított második szintű gyorsítótárat tartalmaz egy 64 bájt széles (az elődjében lévőnél kétszer szélesebb[1]) sínen, ezen felül még egy 8 MiB eDRAM-os kialakítású L3 gyorsítótárat, amelyet a minicsipek megosztva használhatnak.[15] Így például egy hat minicsipes processzornak 48 MiB L3 eDRAM-os gyorsítótára, egy 12 minicsipes processzornak összesen 96 MiB L3 eDRAM-os gyorsítótára lehet. A csip ki tud használni még egy max. 128 MiB méretű csipen kívüli eDRAM L4 gyorsítótárat a Centaur kísérő csipek segítségével. A lapkára integrált memóriavezérlők 1 TiB RAM-ot képesek kezelni és 230 GiB/s folyamatos memória sávszélességet tartanak fenn. A kártyára szerelt PCI Express vezérlők 48 GiB/s be-/kimeneti sebességet biztosítanak a rendszer más részeihez. A magokat 2,5 és 5 GHz közötti órajelfrekvencia használatára tervezték.[14]
A 6 magos verzióban a magok párosan helyezkednek el és kétcsipes modulokban (DCM) kerülnek az IBM Power Systems méretezhető (scale-out) szervereibe. A konfigurációk nagy részében nem minden mag aktív, ezáltal a cég konfigurációk széles választékát kínálhatja, amelyekben a tényleges magok száma eltérő. 2014 májusáig a 12 magos változat egyik konfigurációban sem jelent meg.
Az IBM egycsipes POWER8 moduljának a neve Turismo,[5] a kétcsipes változat neve Murano.[23] A PowerCore átalakított verziójának jelölése egyszerűen CP1.
2014. január 19-én a Suzhou PowerCore Technology Company bejelentette, hogy csatlakoznak az OpenPOWER Alapítványhoz és licencelik a POWER8 magot, egyedi gyártású processzorok tervezéséhez, big data és felhő alapú számítástechnikai alkalmazásokban történő felhasználásra.[24][25]
Ez a szócikk részben vagy egészben a POWER8 című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.