پردازنده‌های بیش هسته‌ای

پردازنده‌های بیش هسته‌ای (به انگلیسی: Manycore processors) انواع خاصی از پردازنده‌های چند هسته‌ای هستند که برای درجه بالایی از پردازش موازی طراحی شده‌اند و شامل تعداد زیادی هسته‌های پردازنده ساده‌تر و مستقل (از چند ده هسته تا هزاران یا بیشتر) می‌باشند. پردازشگرهای بیش هسته ای به‌طور گسترده در کامپیوترهای تعبیه‌شده و محاسبات با کارایی بالا مورد استفاده قرار می‌گیرند.

مقایسه با معماری چند هسته‌ای

[ویرایش]

پردازشگرهای بیش هسته ای از پردازشگرهای چند هسته‌ای در بهینه‌سازی از ابتدا برای درجه بالاتری از توازن صریح، و برای توان عملیاتی بالاتر (یا مصرف توان کم‌تر) به قیمت تأخیر و عملکرد تک‌رشته‌ای پایین‌تر متمایز هستند.

در مقابل، دسته گسترده‌ترپردازنده‌های چند هسته معمولاً برای اجرای کارآمد هر دو کد موازی و سری طراحی شده‌اند و بنابراین تأکید بیشتری بر عملکرد تک رشته‌ای بالا (به عنوان مثال اختصاص بیشتر سیلیکون به خارج از اجرای ترتیب، خطوط لوله عمیق‌تر، واحدهای اجرای فوق عددی بیشتر و مخازن بزرگتر و کلی تر) و حافظه اشتراکی دارند. این تکنیک‌ها منابع زمان اجرا را به یافتن توازن ضمنی در یک رشته واحد اختصاص می‌دهند. آنها در سیستم‌هایی مورد استفاده قرار می‌گیرند که به‌طور پیوسته (با سازگاری رو به عقب) از پردازنده‌های تک هسته ای تکامل یافته‌اند. آنها معمولاً تعداد کمی هسته دارند (به عنوان مثال ۲، ۴، ۸)، و ممکن است با یک شتاب‌دهنده بیش هسته ای (مانند یک GPU) در یک سیستم ناهمگن تکمیل شوند.

انگیزه

[ویرایش]

انسجام حافظه نهان موضوعی است که مقیاس پردازنده‌های چند هسته ای را محدود می‌کند. پردازنده‌های بیش هسته ای ممکن است این موضوع را با روش‌هایی مانند عبور پیام،[۱] حافظه چرک‌نویس، DMA ,[۲] فضای آدرس سراسری جزء بندی شده، یا حافظه‌های نهان فقط خواندنی/غیر منسجم، نادیده بگیرند. یک پردازنده بیش هسته ای با استفاده از یک شبکه روی یک تراشه و حافظه محلی به نرم‌افزار این فرصت را می‌دهد تا به‌طور صریح طرح فضایی وظایف را بهینه کند (به عنوان مثال همان‌طور که در ابزار توسعه یافته برای TrueNorth مشاهده می‌شود).[۳]

پردازنده‌های بیش هسته ای ممکن است شباهت‌های بیشتری (از لحاظ مفهومی) با فناوری‌هایی داشته باشند که از محاسبات با کارایی بالا مانند خوشه‌ها و پردازنده‌های برداری سرچشمه می‌گیرند.[۴]

پردازنده‌های گرافیکی ممکن است شکلی از پردازنده‌های بیش هسته‌ای که دارای واحدهای پردازش سایه‌زن متعدد هستند در نظر گرفته شوند که تنها برای کدهای بسیار موازی مناسب هستند (توان عملیاتی بالا، اما عملکرد بسیار ضعیف تک رشته‌ای).

مدل‌های برنامه‌نویسی مناسب

[ویرایش]

رده‌های سیستم‌های بیش هسته‌ای

[ویرایش]

معماری‌های بیش هسته‌ای خاص

[ویرایش]
  • ZettaScaler [۱]، ماژول‌های ۲۰۴۸ هسته ای PEZY Computing ژاپنی
  • پردازنده کمکی Xeon Phi که دارای معماری MIC (هسته‌های مجتمع متعدد) است
  • Tilera
  • Adapteva Epiphany Architecture، یک تراشه بیش هسته ای با استفاده از حافظه اسکرچ پد PGAS
  • پردازنده Coherent Logix hx3100، یک پردازنده ۱۰۰ هسته ای DSP/GPP بر اساس معماری HyperX
  • Movidius Myriad 2، یک واحد پردازش بینایی بیش هسته ای (VPU)
  • Kalray ، شتاب‌دهندهٔ PCI-e با هسته‌ای برای کارهایی که داده‌های فشرده دارند
  • تراشه تحقیقاتی Teraflops، یک پردازنده بیش هسته ای با استفاده از ارسال پیام
  • TrueNorth، یک شتاب‌دهنده هوش مصنوعی با یک شبکه بیش هسته ای در معماری تراشه
  • آرایه‌های سبز، یک پردازنده بیش هسته ای با استفاده از ارسال پیام با هدف برنامه‌های کاربردی کم مصرف
  • Sunway SW26010، یک پردازنده ۲۶۰ هسته ای بیش هسته ای مورد استفاده در یک ابر کامپیوتر عالی به نام سان وی تالایت استفاده شد.
    • SW52020، یک نوع بهبود یافته ۵۲۰ هسته ای[۶][۷] از SW26010، با SIMD 512 بیتی (همچنین با اضافه کردن پشتیبانی برای نیم دقت)، در یک نمونه اولیه، برای یک سیستم مقیاس بزرگ (و در آینده سیستم ۱۰ مقیاس بزرگ) استفاده می‌شود. و طبق داده‌های سنتردینامیک، چین در حال حاضر دارای دو سیستم مجزای مقیاس اگزا به صورت مخفیانه است
  • Eyeriss، یک پردازنده بیش هسته ای طراحی شده برای اجرای شبکه‌های عصبی کانولوشن برای برنامه‌های بینایی جاسازی شده[۸]
  • Graphcore، یک شتاب‌دهنده هوش مصنوعی چند هسته ای

رایانه‌های بیش هسته‌ای خاص با بیش از ۱ میلیون هسته

[ویرایش]

تعدادی از کامپیوترهای ساخته‌شده از پردازنده‌های چندهسته‌ای دارای یک میلیون یا بیشتر هسته منحصر به فرد CPU هستند. مثال‌ها عبارتند از:

  • Sunway TaihuLight ، یک ابررایانه چینی بسیار موازی (۱۰ میلیون هسته CPU)، که زمانی یکی از سریع‌ترین ابررایانه‌های جهان بود که از معماری چند هسته‌ای سفارشی استفاده می‌کرد.[نیازمند منبع] از نوامبر ۲۰۱۸، سومین ابررایانه سریع جهان (بر اساس فهرست TOP500)، Sunway TaihuLight چینی، عملکرد خود را از ۴۰۹۶۰ پردازنده SW26010 بیش هسته‌ای، که هر کدام شامل ۲۵۶ هسته است، به دست می‌آورد.
  • Gyoukou (به ژاپنی: 暁光Hepburn: gyōkō، روشنایی سپیده‌دم)، ابررایانه‌ای که توسط ExaScaler و PEZY Computing توسعه یافته‌است، با ۲۰۴۸۰۰۰۰ عنصر پردازشی در مجموع به اضافه ۱۲۵۰ پردازنده میزبان Intel Xeon D.
  • SpiNNaker، یک پردازنده بسیار موازی (1M هسته CPU) با چند هسته (بر پایه ARM) که به عنوان بخشی از پروژه مغز انسان ساخته شده‌است.

رایانه‌های خاص با بیش از ۵ میلیون هسته

[ویرایش]

تعداد کمی از ابرکامپیوترها دارای بیش از یک میلیون و حتی بیش از ۵ میلیون هسته CPU هستند. در حالی که که پردازنده‌های مشترک نیز وجود دارد، به عنوان مثال پردازنده‌های گرافیکی مورد استفاده، آن هسته‌ها در شمارش هسته فهرست نشده‌اند، سپس تعداد کمی از رایانه‌های دیگر به آن اهداف دست می‌یابند.

  • Fugaku، یک ابر رایانه ژاپنی با استفاده از هسته‌های مبتنی بر ARM Fujitsu A64FX، در مجموع ۷٬۶۳۰٬۸۴۸.
  • Sunway TaihuLight، یک ابررایانه چینی بسیار موازی (10M هسته CPU).

جستارهای وابسته

[ویرایش]

منابع

[ویرایش]
  1. Mattson, Tim (January 2010). "The Future of Many Core Computing: A tale of two processors" (PDF).
  2. Hendry, Gilbert; Kretschmann, Mark. "IBM Cell Processor" (PDF). Archived from the original (PDF) on 15 June 2022. Retrieved 11 December 2021.
  3. Amir, Arnon (June 11, 2015). "IBM SyNAPSE Deep Dive Part 3". IBM Research.
  4. "cell architecture"."The Cell architecture is like nothing we have ever seen in commodity microprocessors, it is closer in design to multiprocessor vector supercomputers"
  5. Rick Merritt (June 20, 2011), "OEMs show systems with Intel MIC chips", www.eetimes.com, EE Times
  6. Morgan, Timothy Prickett (2021-02-10). "A First Peek At China's Sunway Exascale Supercomputer". The Next Platform (به انگلیسی). Retrieved 2021-11-18.
  7. Hemsoth, Nicole (2021-04-19). "China's Exascale Prototype Supercomputer Tests AI Workloads". The Next Platform (به انگلیسی). Retrieved 2021-11-18.
  8. Chen, Yu-Hsin and Krishna, Tushar and Emer, Joel and Sze, Vivienne (2016). "Eyeriss: An Energy-Efficient Reconfigurable Accelerator for Deep Convolutional Neural Networks". IEEE International Solid-State Circuits Conference, ISSCC 2016, Digest of Technical Papers. pp. 262–263.{{cite web}}: نگهداری یادکرد:نام‌های متعدد:فهرست نویسندگان (link)

پیوند به بیرون

[ویرایش]