Rr10000

NEC VR10000.

R10000, me emrin e koduar "T5", është një implementim i mikroprocesorit RISC i arkitekturës së grupit të instruksioneve MIPS IV (ISA) i zhvilluar nga MIPS Technologies, Inc. (MTI), më pas një divizion i Silicon Graphics, Inc. (SGI). Dizajnerët kryesorë janë Chris Rowen dhe Kenneth C. Yeager. Mikroarkitektura R10000 njihet si ANDES, një shkurtim për Arkitekturën me Planifikimin Dinamik Jo-sekuencial të Ekzekutimit. R10000 zëvendëson kryesisht R8000 në nivelet e larta dhe R4400 diku tjetër. MTI ishte një kompani gjysmëpërçuese pa fabula ; R10000 është fabrikuar nga NEC dhe Toshiba . Fabrikuesit e mëparshëm të mikroprocesorëve MIPS si Integrated Device Technology (IDT) dhe tre të tjerë nuk e fabrikuan R10000 pasi ishte më e shtrenjtë për ta bërë këtë se R4000 dhe R4400.

R10000 u prezantua në janar 1996 në frekuencat e orës 175 MHz dhe 195 MHz. Një 150 Versioni MHz u prezantua në linjën e produkteve O2 në 1997, por u ndërpre menjëherë pas kësaj për shkak të preferencës së klientit për 175 Versioni MHz. R10000 nuk ishte i disponueshëm në vëllime të mëdha deri më vonë gjatë vitit për shkak të problemeve të fabrikimit në shkritoret e MIPS. 195 Versioni MHz ishte në furnizim të shkurtër gjatë gjithë vitit 1996 dhe çmimi i tij ishte 3,000 USD si rezultat.

Më 25 shtator 1996, SGI njoftoi se R10000-të e fabrikuara nga NEC midis marsit dhe fundit të korrikut të atij viti ishin të gabuara, duke tërhequr shumë rrymë dhe duke shkaktuar mbylljen e sistemeve gjatë funksionimit. SGI tërhoqi 10,000 R10000 që ishin dërguar në sisteme si rezultat, gjë që ndikoi në fitimet e kompanisë.

Në vitin 1997, një version i R10000 u krijua në 0.25 Procesi μm mundësoi që mikroprocesori të arrinte 250 MHz.

Përdoruesit e R10000 përfshijnë:

  • SGI:
    • Stacionet e punës: Indigo2 (IMPACT Generation), Octane, O2
    • Serverët: Sfida, Origjina 2000
    • Superkompjuterët: Onyx, Onyx2
  • NEC, në superkompjuterin e tij Cenju-4
  • Siemens Nixdorf, në serverët e tij të drejtuar nën SINIX
  • Tandem Computers, në serverët e tij tolerantë ndaj gabimeve Himalaja
NEC VR10000 e shtënë me vdekje.

R10000 është një dizajn superskalar me katër drejtime që zbaton riemërtimin e regjistrave dhe ekzekuton udhëzime jashtë rendit . Dizajni i tij është një largim nga mikroprocesorët e mëparshëm MTI si R4000, i cili është një dizajn skalar shumë më i thjeshtë në rregull që mbështetet kryesisht në shpejtësitë e larta të orës për performancën.

R10000 merr katër instruksione çdo cikël nga cache e instruksioneve. Këto udhëzime deshifrohen dhe më pas vendosen në radhët e instruksioneve me numër të plotë, me pikë lundruese ose ngarkim/ruajtje në varësi të llojit të instruksionit. Njësia e dekodimit ndihmohet nga udhëzimet e para-dekoduara nga cache e instruksioneve, të cilat i shtojnë pesë bit çdo instruksioni për të mundësuar njësinë të identifikojë shpejt se në cilën njësi ekzekutimi është ekzekutuar instruksioni dhe të riorganizojë formatin e instruksionit për të optimizuar dekodimin. procesi.

Secila nga radhët e udhëzimeve mund të pranojë deri në katër udhëzime nga dekoderi, duke shmangur çdo pengesë. Radhët e udhëzimeve lëshojnë udhëzimet e tyre për njësitë e tyre të ekzekutimit në mënyrë dinamike në varësi të disponueshmërisë së operandëve dhe burimeve. Secila nga radhët, përveç radhës së ngarkesës/magazinimit, mund të lëshojë deri në dy instruksione çdo cikël për njësitë e saj të ekzekutimit. Radha e ngarkesës/magazinimit mund të lëshojë vetëm një udhëzim. Kështu, R10000 mund të lëshojë deri në pesë udhëzime çdo cikël.

Njësia e numrave të plotë përbëhet nga skedari i regjistrit të numrave të plotë dhe tre tubacione, dy numra të plotë, një depo ngarkese. Skedari i regjistrit të numrave të plotë është 64 bit i gjerë dhe përmban 64 hyrje, nga të cilat 32 janë regjistra arkitekturorë dhe 32 janë regjistra të riemërtimit që zbatojnë riemërtimin e regjistrave. Skedari i regjistrit ka shtatë porte leximi dhe tre porte shkrimi. Të dy tubacionet me numra të plotë kanë një grumbullues dhe një njësi logjike. Sidoqoftë, vetëm tubacioni i parë ka një zhvendosës fuçi dhe pajisje për të konfirmuar parashikimin e degëve të kushtëzuara. Tubacioni i dytë përdoret për të hyrë në shumëzues dhe ndarës. Shumëzimet janë të tubuara dhe kanë një vonesë me gjashtë cikle për numrat e plotë 32-bit dhe dhjetë për numrat e plotë 64-bit. Ndarja nuk është tubacion. Ndarësi përdor një algoritëm jo-rikthyes që prodhon një bit për cikël. Latencat për ndarjet 32-bit dhe 64-bit janë përkatësisht 35 dhe 67 cikle.

Njësi me pikë lundruese

[Redakto | Redakto nëpërmjet kodit]

Njësia me pikë lundruese (FPU) përbëhet nga katër njësi funksionale, një grumbullues, një shumëzues, njësi pjesëtuese dhe njësi rrënjë katrore. Mbledhja dhe shumëzuesi janë të vendosura, por njësitë e ndarjes dhe rrënjës katrore jo. Shtesat dhe shumëzimet kanë një vonesë prej tre ciklesh dhe mbledhësi dhe shumëzuesi mund të pranojnë një instruksion të ri çdo cikël. Njësia e ndarjes ka një vonesë prej 12 ose 19 ciklesh, në varësi të faktit nëse ndarja është përkatësisht me saktësi të vetme ose me saktësi të dyfishtë.

Njësia e rrënjës katrore ekzekuton instruksionet e rrënjës katrore dhe të rrënjës katrore reciproke . Udhëzimet e rrënjës katrore kanë një vonesë prej 18 ose 33 ciklesh për saktësi të vetme ose saktësi të dyfishtë, përkatësisht. Një udhëzim i ri me rrënjë katrore mund t'i lëshohet njësisë së ndarjes çdo 20 ose 35 cikle përkatësisht për saktësi të vetme dhe saktësi të dyfishtë. Rrënjët katrore reciproke kanë vonesa më të gjata, përkatësisht 30 deri në 52 cikle për saktësi të vetme (32-bit) dhe saktësi të dyfishtë (64-bit).

Skedari i regjistrit me pikë lundruese përmban gjashtëdhjetë e katër regjistra 64-bitësh, nga të cilët tridhjetë e dy janë arkitekturorë dhe pjesa tjetër janë regjistra të riemërtimit. Mbledhja ka portet e veta të dedikuara për leximin dhe shkrimin, ndërsa shumëzuesi e ndan atë me njësinë e ndarësit dhe rrënjës katrore.

Njësitë e ndarjes dhe rrënjës katrore përdorin algoritmin SRT . MIPS IV ISA ka një instruksion multiply–add. Ky udhëzim zbatohet nga R10000 me një anashkalim — rezultati i shumëzimit mund të anashkalojë skedarin e regjistrit dhe të dorëzohet në tubacionin e mbledhjes si një operand, kështu që nuk është një shumëzim-shtim i shkrirë dhe ka një vonesë me katër cikle.

Memoriet e fshehta

[Redakto | Redakto nëpërmjet kodit]

R10000 ka dy cache relativisht të mëdha në çip, një 32 KB memorie instruksionesh dhe një 32 KB cache e të dhënave. Memoria e instruksionit është e dyanshme dhe ka një madhësi rreshti 128 bajt. Instruksionet deshifrohen pjesërisht duke i shtuar katër bit secilit instruksion (të cilët kanë një gjatësi prej 32 bit) përpara se të vendosen në cache.

32 Cache e të dhënave KB transportohet me dy porta përmes ndërthurjes me dy drejtime. Ai përbëhet nga dy 16 Bankat e KB-së dhe secila bankë janë grup-shoqëruese të dyanshme. Cache ka linja 64-byte, përdor protokollin e kthimit dhe indeksohet virtualisht dhe etiketohet fizikisht për të mundësuar që cache të indeksohet në të njëjtin cikël orësh dhe të ruajë koherencën me cache-në dytësore.

Memoria e jashtme sekondare e unifikuar mbështeti kapacitetet midis 512 KB dhe 16 MB. Është implementuar me memorie të aksesit të rastësishëm statik sinkron të mallrave (SSRAM). Memoria e memories aksesohet nëpërmjet autobusit të vet 128-bit, i cili mbrohet nga kodi i korrigjimit të gabimeve (ECC) 9-bitësh. Cache dhe autobus funksionojnë në të njëjtën shpejtësi si R10000, frekuenca maksimale e të cilit ishte 200 MHz. Në 200 MHz, autobusi dha një gjerësi bande maksimale prej 3.2 GB/s. Memoria e fshehtë është shoqëruese e grupit të dyanshëm, por për të shmangur një numërim të lartë të pineve, R10000 parashikon se në cilën mënyrë aksesohet.

MIPS IV është një arkitekturë 64-bit, por për të ulur koston, R10000 nuk zbaton të gjithë adresën fizike ose virtuale . Në vend të kësaj, ai ka një adresë fizike 40-bit dhe një adresë virtuale 44-bit, kështu që është në gjendje të adresojë 1 TB memorie fizike dhe 16 TB memorie virtuale .

Autobus i sistemit të ortekut

[Redakto | Redakto nëpërmjet kodit]

R10000 përdor autobusin Avalanche, një autobus 64-bitësh që funksionon në frekuenca deri në 100 MHz. Orteku është një autobus i shumëfishuar adresash dhe të dhënash, pra në 100 MHz jep një gjerësi maksimale teorike prej 800 MB/s, por gjerësia e bandës së saj maksimale është 640 MB/s pasi kërkon disa cikle për të transmetuar adresat.

Kontrolluesi i ndërfaqes së sistemit mbështet shumëpërpunim simetrik pa ngjitës (SMP) deri në katër mikroprocesorë. Sistemet që përdorin R10000 me logjikë të jashtme mund të shkallëzohen në qindra procesorë. Një shembull i një sistemi të tillë është Origin 2000 .

R10000 përbëhet nga afërsisht 6.8 milion transistorë, nga të cilët afërsisht 4.4 milion gjenden në memoriet kryesore. [1] Diametri i madhësisë është 16.640 me 17.934 mm, për një sipërfaqe prej 298.422 mm 2 . Është fabrikuar në 0.35 proces mikrom dhe i paketuar në rrjetin e rrjetit tokësor qeramik me 599 shtresa (LGA). Përpara se të prezantohej R10000, Raporti i Mikroprocesorit, që mbulonte Forumin e Mikroprocesorëve të vitit 1994, raportoi se ai ishte i paketuar në një rrjet rrjeti me pin qeramike 527-pin (CPGA); dhe se shitësit hetuan gjithashtu mundësinë e përdorimit të një moduli me shumë çipa 339-pin (MCM) që përmban dizinën e mikroprocesorit dhe 1 MB cache. [2]

R10000 u zgjerua nga derivate të shumëfishtë të njëpasnjëshëm. Të gjithë derivatet pas R12000 kanë frekuencën e orës së tyre të mbajtur sa më të ulët të jetë e mundur për të ruajtur shpërndarjen e energjisë në 15 deri në 20 Gama W në mënyrë që ato të mund të paketohen dendur në sistemet kompjuterike me performancë të lartë (HPC) të SGI.

NEC VR12000 e shtënë me vdekje.

R12000 është një derivat i R10000 i filluar nga MIPS dhe i përfunduar nga SGI. Është fabrikuar nga NEC dhe Toshiba. Versioni i prodhuar nga NEC quhet VR12000. Mikroprocesori u prezantua në nëntor 1998. Është në dispozicion në 270, 300 dhe 360 MHz. R12000 u zhvillua si një zgjidhje ndaluese pas anulimit të projektit "Beast", i cili synonte të jepte një pasardhës të R10000. Përdoruesit e R12000 përfshijnë NEC, Siemens-Nixdorf, SGI dhe Tandem Computers (dhe më vonë Compaq, pas blerjes së Tandem).

R12000 përmirëson mikroarkitekturën R10000 duke: futur një fazë shtesë të tubacionit për të përmirësuar frekuencën e orës duke zgjidhur një shteg kritik; rritja e numrit të hyrjeve në tabelën e historisë së degëve, përmirësimi i parashikimit; duke modifikuar radhët e instruksioneve në mënyrë që ata të marrin parasysh moshën e një instruksioni në radhë, duke mundësuar që instruksionet më të vjetra të ekzekutohen përpara atyre të reja nëse është e mundur.

R12000 është fabrikuar nga NEC dhe Toshiba në 0.25 μm proces CMOS me katër nivele të ndërlidhjes së aluminit . Përdorimi i një procesi të ri nuk do të thotë që R12000 ishte një tkurrje e thjeshtë me një mikroarkitekturë të modifikuar; faqosja e mbulesës është optimizuar për të përfituar nga 0.25 procesi μm. [3] NEC i fabrikuar VR12000 përmbante 7.15 milionë transistorë dhe matej 15.7 me 14.6 mm (229.22 mm 2 ).

R12000A është një derivat i R12000 i zhvilluar nga SGI. I prezantuar në korrik 2000, funksionon në 400 MHz dhe është fabrikuar nga NEC një 0.18 proces μm me ndërlidhje alumini .

R14000 është një zhvillim i mëtejshëm i R12000 i shpallur në korrik 2001. R14000 funksionon me 500 MHz, i mundësuar nga 0.13 μm Procesi CMOS me pesë nivele të ndërlidhjes së bakrit me të cilin është fabrikuar. Ai përmban përmirësime në mikroarkitekturën e R12000 duke mbështetur SSRAM-të me shpejtësi të dyfishtë të të dhënave (DDR) për cache-në sekondare dhe një 200 Autobusi i sistemit MHz. [4]

R14000A është një zhvillim i mëtejshëm i R14000 i shpallur në shkurt 2002. Ajo funksionon në 600 MHz, shpërndahet afërsisht 17 W, dhe u fabrikua nga NEC Corporation në 0.13 μm proces CMOS me shtatë nivele të ndërlidhjes së bakrit. [4]

R16000, me emrin e koduar "N0", është derivati i fundit i R10000. Është zhvilluar nga SGI dhe fabrikuar nga NEC në 0.11 e tyre proces μm me tetë nivele të ndërlidhjes së bakrit. Mikroprocesori u prezantua më 9 janar 2003, duke debutuar në 700 MHz për karburant dhe përdoret gjithashtu në Onyx4 Ultimate Vision . Në prill 2003, 600 Versioni MHz u prezantua për Origin 350 . Përmirësimet janë 64 Instruksionet KB dhe memoriet e të dhënave.

R16000A i referohet mikroprocesorëve R16000 me shpejtësi të orës më të larta se 700 MHz. R16000A e parë është një 800 Versioni MHz, i prezantuar më 4 shkurt 2004. Më vonë, 900 U prezantua versioni MHz dhe ky version ishte, për ca kohë, R16000A më i shpejtë i njohur publikisht — SGI më vonë zbuloi se kishte 1.0 GHz R16000 dërgohen te klientët e përzgjedhur. Përdoruesit R16000 përfshinin HP dhe SGI. SGI përdori mikroprocesorin në stacionet e tyre të punës Fuel dhe Tezro ; dhe serverët dhe superkompjuterët Origin 3000 . HP përdori R16000A në serverët e tyre NonStop Himalaya S-Series tolerantë ndaj gabimeve të trashëguar nga Tandem nëpërmjet Compaq.

R18000 është një zhvillim i mëtejshëm i anuluar i mikroarkitekturës R10000 që shfaqi përmirësime të mëdha nga Silicon Graphics, Inc. të përshkruara në simpoziumin Hot Chips në 2001. R18000 është projektuar posaçërisht për serverët dhe superkompjuterët ccNUMA të SGI. Çdo nyje do të kishte dy R18000 të lidhura nëpërmjet një autobusi të shumëfishuar me një kontrollues sistemi, i cili do të ndërlidhte mikroprocesorët me memorien e tyre lokale dhe pjesën tjetër të sistemit nëpërmjet një rrjeti hiperkub.

R18000 përmirësoi radhët e udhëzimeve me pikë lundruese dhe rishikoi njësinë me pikë lundruese për të shfaqur dy njësi shumëzo-shto, duke katërfishuar numrin maksimal të FLOPS. Ndarja dhe rrënja katrore do të kryheshin në njësi të ndara pa tubacion paralelisht me njësitë shumëzo-shto. Ndërfaqja e sistemit dhe hierarkia e kujtesës gjithashtu u ripunuan ndjeshëm. Do të kishte një adresë virtuale 52-bit dhe një adresë fizike 48-bit. Autobusi i adresave të shumëfishta me dy drejtime dhe sistemi i të dhënave të modeleve të mëparshme do të zëvendësohej nga dy lidhje DDR të njëanshme, një adresë e shumëfishtë 64-bit dhe një shteg shkrimi dhe një shteg leximi 128-bit. Shtigjet mund të ndahen me një tjetër R18000 përmes multipleksimit. Autobusi mund të konfigurohet gjithashtu në konfigurimin SysAD ose Avalanche për pajtueshmërinë e pasme me sistemet R10000.

R18000 do të kishte një 1 MB memorie e memories dytësore shoqëruese e grupeve me katër drejtime për t'u përfshirë në die; plotësohet nga një memorie terciare opsionale e ndërtuar nga shpejtësia e vetme e të dhënave (SDR) ose shpejtësia e dyfishtë e të dhënave (DDR) SSRAM ose DDR SDRAM me kapacitete nga 2 deri në 64 MB. Memoria e memories L3 do të kishte etiketat e saj të cache, ekuivalente me 400 KB, i vendosur në die për të reduktuar vonesën. Cache L3 do të aksesohej nëpërmjet një autobusi 144-bit, nga të cilët 128 bit janë për të dhëna dhe 16 bit për ECC. Shpejtësia e orës së cache L3 do të ishte e programueshme.

R18000 do të fabrikohej në procesin UX5 të NEC, një 0.13 μm proces CMOS me nëntë nivele të ndërlidhjes së bakrit . Do të kishte përdorur 1.2 Furnizimi me energji V dhe shpërndau më pak nxehtësi sesa mikroprocesorët bashkëkohorë të serverëve në mënyrë që të paketohen dendur në sisteme.

  1. ^ Yeager, Kenneth C. (prill 1996). "The MIPS R10000 Superscalar Microprocessor" (PDF). IEEE Micro. 16 (2): 28. doi:10.1109/40.491460. Arkivuar nga origjinali (PDF) më 19 korrik 2011. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  2. ^ Gwennap, Linley (24 tetor 1994). "MIPS R10000 Uses Decoupled Architecture" (PDF). Microprocessor Report. 8: 4. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  3. ^ Gwennap, Linley (6 tetor 1997). "MIPS R12000 to Hit 300 MHz" (PDF). Microprocessor Report. 11. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  4. ^ a b ComputerWire (2 korrik 2002). "SGI to develop MIPS chips for Origin, Onyx". The Register. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)