Fujitsu A64FX

A64FX
Gyártás2019
TervezőFujitsu
GyártóTSMC
Max CPU órajel1,8 GHz, 2 GHz, 2,2 GHz[1]
Gyártás technológia méret7 nanométeres CMOS FinFET[1]
UtasításkészletAArch64
ArchitektúraARMv8.2-A SVE-vel,[2][1] SBSA 3. szint
Mikroarchitektúrabelső fejlesztésű
Magok számaprocesszoronként 48,[3] + 2 v. 4 kiegészítő mag[4][5]
L1 gyorsítótár3 MiB (64 KiB magonként) utasítás-, 3 MiB (64 KiB magonként) adat-gyorsítótár
L2 gyorsítótár32 MiB (8 MiB × 4)[1]
Tokozás594 érintkezős BGA
FoglalatPCIe Gen3 16 sáv [15,75 GB/s (be/ki)]
Tranzisztorok száma8,786 milliárd[1]
PlatformHPC[6]
Alkalmazásaszuperszámítógépek, nagy teljesítményű kiszolgálók
ElődSPARC64 V

Az A64FX egy 64 bites ARM architektúrán alapuló mikroprocesszor, amelyet a Fujitsu tervezett.[3][7] A processzor a SPARC64 V processzorokat váltja fel a Fujitsu szuperszámítógépes rendszereiben.[8] A Fugaku szuperszámítógép is A64FX processzorokra épül; ez a gép 2020. júniusától a világ leggyorsabb szuperszámítógépeként szerepelt a TOP500 listában, míg 2022 júniusában megelőzte a Frontier szuperszámítógép, így a második helyre esett vissza.[9][7][8][10]

Tervezés

[szerkesztés]

A Fujitsu az Arm vállalattal együttműködve fejlesztette ki a processzort; ez az első processzor, amely az ARMv8.2-A Scalable Vector Extension (SVE) SIMD utasításkészlet használja, 512 bites vektoros megvalósítással.[7]

A processzor rendelkezik négy operandusú összevont szorzás-összeadás (FMA) prefix utasítással,[3] azaz egy MOVPRFX utasítással, amelyet 3 operandusú FMA művelet követ (az ARM, mint a RISC processzorok általánosan, 3 operandusú gép, amelynek utasításkódolása nem teszi lehetővé több, pl. négy operandus használatát), de ezeket egyetlen műveletbe vonja össze az utasítás-futószalagon. A processzorról a tervező azt állítja, hogy 90%-nál magasabb végrehajtási hatékonyságot ér el a (D|S|H)GEMM (általános mátrixszorzás)[11] és INT16/INT8 skaláris szorzat műveletekben.[3]

A processzor 32 GiB HBM2 memóriát használ, másodpercenként 1 TiB sávszélességgel.[7] A processzor 16 3. generációs PCI Express sávot alkalmaz[3] különböző külső gyorsítóegységekhez való csatlakozásra (hipotetikusan például GPU-khoz és FPGA-khoz). A processzor egy Tofu-D összeköttetés-hálózat vezérlőt is integrál 10 porttal, amely 20 sávon nagy sebességű 28 GBps átvitelt biztosít a csomópontokhoz való csatlakozásra egy klaszterben.[3] A processzor bejelentett tranzisztorszáma közel 8,8 milliárd.[7]

Minden A64FX processzor négy NUMA csomóponttal rendelkezik, és minden egyes NUMA csomópont 12 számító magot tartalmaz, így a processzorok összesen 48 magot tartalmaznak.[12][4][5] Mindegyik NUMA csomópontnak saját második szintű gyorsítótára van, emellett HBM2 memóriával és segédmagokkal van ellátva a nem számítási feladatokhoz. A segédprocesszorok egyik feladata a nagy sebességű kommunikáció biztosítása a háttérben.[12]

A Fujitsu folyamatosan fejleszti a „RAS” (Reliability – megbízhatóság, Availability – rendelkezésre állás, Serviceability – használhatóság) képességeket eszközeiben. A hibatűrés érdekében az A64FX processzorban közel 128 400 hibaellenőrzési pontot valósítottak meg. A cég a szuperszámítógépes piacon kívüli területeken is tervezi a processzor alkalmazását, alacsonyabb specifikációjú gépekben.[4][5]

2020 júniusában az A64FX processzorokkal épült Fugaku szuperszámítógép elérte a 4,2 petaFLOPS-os teljesítményt és ezzel megszerezte a világ leggyorsabb szuperszámítógépe címet, amit 2022 közepéig tartott.[13][9]

Alkalmazása

[szerkesztés]

A Fujitsu az A64FX processzort kifejezetten a Fugaku szuperszámítógép számára tervezte. 2020 júniusában és novemberében a Fugaku volt a leggyorsabb szuperszámítógép a TOP500 rangsor szerint.[14] A Fujitsu kisebb A64FX processzoros gépeket is próbált értékesíteni.[4][5] Az Anandtech 2020 júniusában arról számolt be, hogy a két A64FX csomópontot tartalmazó PRIMEHPC FX700 szerver ára 4 155 330 ¥ (kb. 39 000 USD) volt.[15]

A Cray szuperszámítógépeket fejleszt az A64FX felhasználásával.[16][17] A Isambard 2 szuperszámítógépet Fujitsu processzorok felhasználásával építi egy konzorcium az Egyesült Királyságban, a Bristoli Egyetem vezetésével, amelyben a „Met Office”, a brit Meteorológiai Hivatal is részt vesz.[18][19] Ez az első Isambard szuperszámítógép továbbfejlesztése, amely szintén ARM architektúrájú Marvell ThunderX2 mikroprocesszorral készült.[19]

Az Ookami egy nyílt tesztrendszer, amelyet az NSF támogat, a Stony Brook Egyetem és a Buffalói Egyetem tartja üzemben, hozzáférést biztosítva a kutatóknak az A64FX processzorokhoz. A rendszer 176 A64FX számítási- és 2 dedikált hibakereső csomópontot tartalmaz, egyenként 32 GiB nagy sávszélességű memóriával és 512 GB-os SSD-vel.[20]

Jegyzetek

[szerkesztés]
  1. a b c d e Fujitsu: FUJITSU Processor A64FX (angol nyelven) (pdf). Datasheet pp. 2. Fujitsu, 2023. február 14. (Hozzáférés: 2024. március 1.)
  2. SVE: Scalable Vector Extension
  3. a b c d e f Hot Chips 30 conference; Fujitsu briefing. Toshio Yoshida. [2020. december 5-i dátummal az eredetiből archiválva].
  4. a b c d Fujitsu Launches New PRIMEHPC Supercomputers Using Fugaku Technology - Fujitsu Global”, www.fujitsu.com, 2019. november 13. (Hozzáférés: 2020. június 28.) 
  5. a b c d FUJITSU Supercomputer PRIMEHPC Specifications. www.fujitsu.com . (Hozzáférés: 2020. június 28.)
  6. HPC: High Performance Computing, nagy teljesítményű számítástechnika
  7. a b c d e Fujitsu Successfully Triples the Power Output of Gallium-Nitride Transistors - Fujitsu Global. www.fujitsu.com . Fujitsu. (Hozzáférés: 2020. március 8.)
  8. a b Fujitsu's A64FX Arm Chip Waves The HPC Banner High”, The Next Platform, 2018. augusztus 24. (Hozzáférés: 2020. március 8.) 
  9. a b June 2022| TOP500. www.top500.org . (Hozzáférés: 2023. június 23.)
  10. Outline of the Development of the Supercomputer Fugaku| RIKEN Center for Computational Science RIKEN Website. www.r-ccs.riken.jp . [2021. január 23-i dátummal az eredetiből archiválva]. (Hozzáférés: 2020. november 18.)
  11. D: kétszeres pontosságú, S: egyszeres pontosságú, H: félpontosságú, GEMM: általános mátrixszorzás (general matrix multiplication); C += A * B művelet, ahol A, B, C nagy méretű mátrixok. Ez nagy mértékben gyorsítható a vektoros számítóművek használatával, mint pl. az SVE (vagy az AVX az x86-os architektúrákban). ld. tesztek
  12. a b Preliminary Performance Evaluation of the Fujitsu A64FX Using HPC Applications, 2020 IEEE International Conference on Cluster Computing (CLUSTER), 523–530. o.. DOI: 10.1109/CLUSTER49012.2020.00075 (2020. szeptember 1.). ISBN 978-1-7281-6677-3 
  13. HPCG - November 2021. www.top500.org . (Hozzáférés: 2024. március 11.)
  14. Supercomputer Fugaku - Supercomputer Fugaku, A64FX 48C 2.2GHz, Tofu interconnect D| TOP500. www.top500.org . (Hozzáférés: 2020. november 18.)
  15. HPC Systems Special Offer: Two A64FX Nodes in a 2U for $40k”, www.anandtech.com, 2020. június 26. (Hozzáférés: 2020. június 28.) 
  16. Cray, Fujitsu Both Bringing Fujitsu A64FX-based Supercomputers to Market in 2020”, HPCwire, 2019. november 13. (Hozzáférés: 2020. március 8.) 
  17. Japan's Fugaku supercomputer is tackling some of the world's biggest problems”, The Japan Times, 2021. január 7. (Hozzáférés: 2021. január 26.) 
  18. February: GW4 Isambard - News and features - University of Bristol. www.bristol.ac.uk . (Hozzáférés: 2020. március 8.)
  19. a b Isambard 2 Is About Driving Technology Diversity”, The Next Platform, 2020. március 9. (Hozzáférés: 2020. március 9.) 
  20. Ookami (angol nyelven). Stony Brook University, Institute for Advanced Computational Science, 2024. (Hozzáférés: 2024. március 1.) „The Ookami HPE (formerly Cray) Apollo 80 system has 176 A64FX compute nodes,...”

Fordítás

[szerkesztés]

Ez a szócikk részben vagy egészben a Fujitsu A64FX című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Források

[szerkesztés]

További információk

[szerkesztés]
  • ThunderX2 – egy másik ARM architektúrájú, nagy teljesítményű számítástechnikát (HPC) célzó mikroprocesszor
  • Huawei Kunpeng 920 – szintén ARM alapú HPC mikroprocesszor (Kunpeng 920-6426 - HiSilicon, WikiChip, 2020-02-15), melyet a Huawei tulajdonában lévő HiSilicon fejlesztett ki. Csak Kínában érhető el.

Kapcsolódó szócikkek

[szerkesztés]