See artikkel vajab toimetamist. (Mai 2021) |
See artikkel ootab keeletoimetamist. (Mai 2021) |
Suure andevahetuskiirusega mälu (inglise high bandwidth memory, lühend HBM) on arvuti mälu liides, mille peamised arendajad on Samsung, AMD ja SK Hynix. See koosneb kolmemõõtmeliselt kuhjatud dünaamilistest muutmäludest ehk DRAM-ist ja mälukontrollerist. Laialdaselt on kasutatud erinevates suure jõudlusega graafikakiirendites, võrguseadmetes, suure jõudlusega andmekeskustes ja mõningates superarvutites (nt NEC SX-Aurora TSUBASA[1] või Fujitsu A64FX[2]). Esimese HBM kiibi tootis SK Hynix 2013. aastal[3] ja esimene seade, kus see kasutusele võeti, oli AMD Fiji seeria graafikakaartides (2015).[4][5]
HBM standard (JESD235) adopteeriti esmalt standardiorganisatsiooni JEDEC poolt 2013. aasta oktoobris.[6] Teine põlvkond (HBM2) on JEDEC poolt aktsepteeritud alates 2016. aasta veebruarist.[7]
HBM saavutab suuremad andmevahetuskiirused ja väiksema energiatarbe, samas vähendades elektroonika kokkupanemisel nõutavat pinda võrreldes DDR4 või GDDR5-ga.[8] See on saavutatud kolmemõõtmeliselt ladudes kuni kaheksa DRAM Integraallülitust kuhja (sh baasintegraallülitus mälukontrolleriga), mis on sisemiselt ühendatud kasutades räni viaaleid[9] (inglise through-silicone via, lühend TSV).
HMB siin on võrreldes DDR4 või GDDR5 siiniga väga lai, kus üks HBM kuhi, ladudes neli DRAM integraallülitust, on kokku 1024 bitti lai (üksikul DRAM integraallülitusel on kaks 128-bitist kanalit). Graafikakaardi, näiteks AMD Radeon VII (Vega 20)[10], liides, mis koosneb neljast sellisest kuhjast, teeb kokku 4096-bitise siini mäluga suhtlemiseks, võrreldes GDDR mäludega, millel on 16 kanalit 32-bitised, mis teeb kokku 512 bitti mäluga suhtlemiseks.
Tänu palju laiemale siinile on HBM mälu kordades kiirem GDDR5 mälust, samas väiksema taktsagedusega ja pingega, mis võimaldab toota tihedamaid mälusid ja madalamat energiatarvet. HBM töötemperatuur on võrreldes GDDR5-ga kuhjumise tõttu kõrgem.[11] HBM liidese tootmine on kulukas ja hinda lisab veel protsessoriga otsene sidumine, samas siini rajad on lühikesed.[12]
Mälu integraallülituste kuhjamine oli algselt turustatud välkmälu tööstuses. Toshiba tutvustas kaheksa kuhjatud NAND välkmälu integraallülitust 2007. aasta aprillis ning Hynix Semiconductors järgnes 2007. aasta septembris 24 NAND välkmälu integraallülituse kuhjaga, mis on kokku ainult 1,4 mm paks.[13][14]
Kolmemõõtmeliselt kuhjatud muutmälu (RAM), kasutades räni viaale (TSV), tehnoloogia turustati Elpida Memory poolt, kes arendas septembris 2009 välja esimese 8 GB DRAM kiibi (neli kuhjatud DDR3 SDRAM integraallülitust) ja väljastas 2011 juunis. 2011. aastal tutvustas SK Hynix 16 GB DDR3-mälu (40 nm klass), kasutades TSV tehnoloogiat. Samsung tutvustas kolmemõõtmeliselt kuhjatud 32 GB DDR3 septembris ning pärast kuulutasid Samsung ja Micron Technology välja TSV-baasil Hybrid Memory Cube (HMC) tehnoloogia oktoobris.[3][15]
HBM liidese arendamine algas AMD poolt aastal 2008, et leida lahendus pidevalt tõusvale mälu energia tarbimisele ja arvuti mälu suurusele. Järgmise mitme aasta jooksul arendas AMD protseduure, kuidas lahendada kuhjatud integraallülituste probleeme. AMD kaasas ka partnereid mälu tööstusest, eriti Korea ettevõte SK Hynix, kellel oli varasem kogemus kolmemõõtmeliselt kuhjatud mäludega, samuti partnereid integraallülituste tööstusest (Taiwani firma UMC) ja pakendamise tööstus (Amkor Technology ja ASE).[16]
HBM arendamine lõppes 2013, kui SK Hynix valmistas esimese HBM mälukiibi ja oli adopteeritud tööstusstandard (JESD235) JEDEC poolt 2013. aasta oktoobris.[3][6]
Esimene HBM kasutav graafikakaart oli AMD Fiji seeria, mis väljastati 2015. aasta juunis.[4]
2016. aasta jaanuaris alustas Samsung HBM2 masstootmist ja samal kuul aktsepteeriti HBM2 JEDEC (JESD235A).[7] Esimene graafikakaart, mis kasutas HBM2 tehnoloogiat, oli Nvidia Tesla P100, see avalikustati ametlikult 2016. aasta aprillis.[17]
Toetab kuni nelja kuhjatud DRAM integraallülitust, kuid kuhja maksimaalne mälumaht on 1 GB ning töökiirus (üks bitt) maksimaalselt kuni 1 GB/s (500 MHz). Siini laius on kuni 1024 bitti kuhja kohta ja maksimaalne siini andmevahetuskiirus ~128 GB/s.[18] Mälu toitepinge 1,3V. Esimesena kasutusel AMD Fiji seeria graafikakaartides.
Sisuliselt sarnane HBM liidesega, kuid kuhjata on võimalik maksimaalselt kaheksa DRAM integraallülitust ja siini laius saab olla suurem kui 1024 bitti. Kuhja maksimaalne mälumaht on 8GB ja tõstetud töökiirus (üks bitt) 2 Gb/s (1000 MHz). 1024 bitise siini laiuse juures teeb maksimaalseks andmeedastuskiiruseks ~256 GB/s. Tööpinge langetati 1,2V peale ja tarbib vähem energiat kui HBM.[18]
Prognoositakse, et HBM2 on eriti kasulik jõudlustundlikes tarbijarakendustes, näiteks virtuaalreaalsus.
2018. aasta lõpus kuulutas JEDEC välja uuendatud HBM2 tehnilise kirjelduse, lisades andmevahetuskiirust ja suurendades mälumahtu.[19] Võimalus kuhjata kuni 12 DRAM integraallülitust, mis teeb kuni 24 GB mälumahtu kuhja kohta. Suurendati töökiirust (üks bitt) 2,4Gb/s (1200 MHz) ja 1024.bitise siini korral kuni 307 GB/s andmevahetuskiirust.[18]
20. märtsil 2019 kuulutas Samsung välja Flashbolt HBM2E, millel oli kaheksa integraallülitus kuhjas ja töökiirus 3,2 Gb/s, võimaldades kuni 16 GB mälumahtu ja 410 GB/s andmevahetuskiirust.[20]
2. juuli 2020 alustas SK Hynix oma HBM2E masstoodangut, millel oli kaheksa integraallülitus kuhjas ja töökiirus 3,6 Gb/s, võimaldades kuni 16 GB mälumahtu ja 460 GB/s andmevahetuskiirust. Vähendati kuhja mõõtmeid 30% ja 50% tarbib vähem energiat võrreldes eelmiste pakke meetoditega[21]
On veel arendamisel, kuid on plaanitud valmis saada 2022. aastaks.[22] HBM3 tuleks odavam, vähendaks tuuma pinge vähem kui 1,2-voldiseks, suurendab võimalikku siini andmevahetuskiirust ~512 GB/s. Samuti kahekordistatakse individuaalse mälu integraallülituse tihedust 8 Gb pealt 16 Gb (~2 GB) peale ja lubatakse kuhjata rohkem kui kaheksa integraallülitust, mis teeb 64 GB mälumahuga graafikakaardid võimalikuks.[23]
2021. aasta veebruaris kuulutas Samsung, et arendab HBM liidest, millel toimub andmete töötlemine mälus. Selline uus viis toob tehisintellekti arvutuste võimekuse mälusse andmete suuremahulise töötlemise suurendamiseks. DRAm optimeeritud tehisintellekti mootor oleks paigutatud igas mälupangas, et minimeerida andmete liikumist ja võimaldada paralleelset töötlemist. Samsung väidab, et see võimaldab topelt süsteemi jõudlust ja vähendab energia tarvet rohkem kui 70% ilma riistvara või tarkvara muutmise vajaduseta terves süsteemis.[24]
{{netiviide}}
: kontrolli kuupäeva väärtust: |vaadatud=
(juhend)[alaline kõdulink]
{{raamatuviide}}
: CS1 hooldus: mitu nime: autorite loend (link)
{{netiviide}}
: kontrolli kuupäeva väärtust: |aeg=
(juhend)