A64FX | |
Gyártás | 2019 |
Tervező | Fujitsu |
Gyártó | TSMC |
Max CPU órajel | 1,8 GHz, 2 GHz, 2,2 GHz[1] |
Gyártás technológia méret | 7 nanométeres CMOS FinFET[1] |
Utasításkészlet | AArch64 |
Architektúra | ARMv8.2-A SVE-vel,[2][1] SBSA 3. szint |
Mikroarchitektúra | belső fejlesztésű |
Magok száma | processzoronként 48,[3] + 2 v. 4 kiegészítő mag[4][5] |
L1 gyorsítótár | 3 MiB (64 KiB magonként) utasítás-, 3 MiB (64 KiB magonként) adat-gyorsítótár |
L2 gyorsítótár | 32 MiB (8 MiB × 4)[1] |
Tokozás | 594 érintkezős BGA |
Foglalat | PCIe Gen3 16 sáv [15,75 GB/s (be/ki)] |
Tranzisztorok száma | 8,786 milliárd[1] |
Platform | HPC[6] |
Alkalmazása | szuperszámítógépek, nagy teljesítményű kiszolgálók |
Előd | SPARC64 V |
Az A64FX egy 64 bites ARM architektúrán alapuló mikroprocesszor, amelyet a Fujitsu tervezett.[3][7] A processzor a SPARC64 V processzorokat váltja fel a Fujitsu szuperszámítógépes rendszereiben.[8] A Fugaku szuperszámítógép is A64FX processzorokra épül; ez a gép 2020. júniusától a világ leggyorsabb szuperszámítógépeként szerepelt a TOP500 listában, míg 2022 júniusában megelőzte a Frontier szuperszámítógép, így a második helyre esett vissza.[9][7][8][10]
A Fujitsu az Arm vállalattal együttműködve fejlesztette ki a processzort; ez az első processzor, amely az ARMv8.2-A Scalable Vector Extension (SVE) SIMD utasításkészlet használja, 512 bites vektoros megvalósítással.[7]
A processzor rendelkezik négy operandusú összevont szorzás-összeadás (FMA) prefix utasítással,[3] azaz egy MOVPRFX utasítással, amelyet 3 operandusú FMA művelet követ (az ARM, mint a RISC processzorok általánosan, 3 operandusú gép, amelynek utasításkódolása nem teszi lehetővé több, pl. négy operandus használatát), de ezeket egyetlen műveletbe vonja össze az utasítás-futószalagon. A processzorról a tervező azt állítja, hogy 90%-nál magasabb végrehajtási hatékonyságot ér el a (D|S|H)GEMM (általános mátrixszorzás)[11] és INT16/INT8 skaláris szorzat műveletekben.[3]
A processzor 32 GiB HBM2 memóriát használ, másodpercenként 1 TiB sávszélességgel.[7] A processzor 16 3. generációs PCI Express sávot alkalmaz[3] különböző külső gyorsítóegységekhez való csatlakozásra (hipotetikusan például GPU-khoz és FPGA-khoz). A processzor egy Tofu-D összeköttetés-hálózat vezérlőt is integrál 10 porttal, amely 20 sávon nagy sebességű 28 GBps átvitelt biztosít a csomópontokhoz való csatlakozásra egy klaszterben.[3] A processzor bejelentett tranzisztorszáma közel 8,8 milliárd.[7]
Minden A64FX processzor négy NUMA csomóponttal rendelkezik, és minden egyes NUMA csomópont 12 számító magot tartalmaz, így a processzorok összesen 48 magot tartalmaznak.[12][4][5] Mindegyik NUMA csomópontnak saját második szintű gyorsítótára van, emellett HBM2 memóriával és segédmagokkal van ellátva a nem számítási feladatokhoz. A segédprocesszorok egyik feladata a nagy sebességű kommunikáció biztosítása a háttérben.[12]
A Fujitsu folyamatosan fejleszti a „RAS” (Reliability – megbízhatóság, Availability – rendelkezésre állás, Serviceability – használhatóság) képességeket eszközeiben. A hibatűrés érdekében az A64FX processzorban közel 128 400 hibaellenőrzési pontot valósítottak meg. A cég a szuperszámítógépes piacon kívüli területeken is tervezi a processzor alkalmazását, alacsonyabb specifikációjú gépekben.[4][5]
2020 júniusában az A64FX processzorokkal épült Fugaku szuperszámítógép elérte a 4,2 petaFLOPS-os teljesítményt és ezzel megszerezte a világ leggyorsabb szuperszámítógépe címet, amit 2022 közepéig tartott.[13][9]
A Fujitsu az A64FX processzort kifejezetten a Fugaku szuperszámítógép számára tervezte. 2020 júniusában és novemberében a Fugaku volt a leggyorsabb szuperszámítógép a TOP500 rangsor szerint.[14] A Fujitsu kisebb A64FX processzoros gépeket is próbált értékesíteni.[4][5] Az Anandtech 2020 júniusában arról számolt be, hogy a két A64FX csomópontot tartalmazó PRIMEHPC FX700 szerver ára 4 155 330 ¥ (kb. 39 000 USD) volt.[15]
A Cray szuperszámítógépeket fejleszt az A64FX felhasználásával.[16][17] A Isambard 2 szuperszámítógépet Fujitsu processzorok felhasználásával építi egy konzorcium az Egyesült Királyságban, a Bristoli Egyetem vezetésével, amelyben a „Met Office”, a brit Meteorológiai Hivatal is részt vesz.[18][19] Ez az első Isambard szuperszámítógép továbbfejlesztése, amely szintén ARM architektúrájú Marvell ThunderX2 mikroprocesszorral készült.[19]
Az Ookami egy nyílt tesztrendszer, amelyet az NSF támogat, a Stony Brook Egyetem és a Buffalói Egyetem tartja üzemben, hozzáférést biztosítva a kutatóknak az A64FX processzorokhoz. A rendszer 176 A64FX számítási- és 2 dedikált hibakereső csomópontot tartalmaz, egyenként 32 GiB nagy sávszélességű memóriával és 512 GB-os SSD-vel.[20]
Ez a szócikk részben vagy egészben a Fujitsu A64FX című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.