Нейронны працэсар

Нейронны працэсар (англ.: Neural Processing Unit, NPU або ШІ-паскаральнік англ.: AI accelerator)- гэта спецыялізаваны клас мікрапрацэсараў і супрацэсараў  (руск.) (якія часта з’яўляюцца спецыялізаванай інтэгральнай схемай  (руск.)), які выкарыстоўваецца для апаратнага паскарэння  (руск.) працы алгарытмаў штучных нейронных сетак  (руск.), камп’ютарнага зроку, распазнавання па голасе  (руск.), машыннага навучання і іншых метадаў штучнага інтэлекту.

Нейронныя працэсары ставяцца да вылічальнай тэхнікі і выкарыстоўваюцца для апаратнага паскарэння  (руск.) эмуляцыі работы нейронных сетак  (руск.) і лічбавай апрацоўкі сігналаў  (руск.) у рэжыме рэальнага часу  (руск.). Як правіла, нейрапрацэсар утрымлівае рэгістр  (руск.), блокі памяці  (руск.) магазіннага тыпу, камутатар  (руск.) і вылічальная прылада, якая змяшчае матрыцу множання, дэшыфратары  (руск.), трыгеры і мультыплексары  (руск.)[1].

На сучасным этапе (па стане на 2017 год) да класа нейронных працэсараў могуць ставіцца розныя па будове і спецыялізацыі тыпы чыпаў, напрыклад:

Вобласць прымянення

[правіць | правіць зыходнік]
Nvidia Drive PX-series  (англ.).

Існуючыя прадукты

[правіць | правіць зыходнік]
16-ядзерны чып Adapteva Epiphany (E16G301) на однаплатным камп’ютары для паралельных вылічэнняў  (руск.).
  • Працэсары машыннага зроку  (руск.):
  • Тэнзарныя працэсы  (руск.):
    • Google TPU  (руск.) (англ.: Tensor Processing Unit) — прадстаўлены як паскаральнік для сістэмы Google TensorFlow  (руск.), якая шырока ўжываецца для згорткавых нейронных сетак. Сфакусаваны на вялікім аб’ёме арыфметыкі 8-бітнай дакладнасці.
    • Huawei Ascend 310/Ascend 910 — першыя два чыпы аптымізаваныя пад рашэнні задач штучнага інтэлекту з лінейкі Ascend кампаніі Huawei[6].
    • Intel Nervana NNP  (англ.) (англ.: Neural Network Processor) — гэта першы камерцыйна даступны тэнзарны працэсар, прызначаны для пабудовы сетак глыбокага навучання, кампанія Facebook была партнёрам у працэсе яго праектавання[7][8]. Qualcomm  (руск.) Cloud AI 100 — паскаральнік штучнага інтэлекту, прызначаны для выкарыстання ў складзе хмарных платформаў, які падтрымлівае праграмныя бібліятэкі PyTorch  (руск.), Glow  (руск.), TensorFlow  (руск.), Keras  (руск.) і ONNX  (руск.)[9].
  • Нейраморфныя працэсары:
    • IBM TrueNorth  (руск.) — нейраморфны працэсар, пабудаваны па прынцыпе ўзаемадзеяння нейронаў, а не традыцыйнай арыфметыкі. Частата імпульсаў прадстаўляе інтэнсіўнасць сігналу. Па стане на 2016 год сярод даследчыкаў ШІ няма кансенсусу, ці з’яўляецца гэта правільным шляхам для прасоўвання, але некаторыя вынікі з’яўляюцца шматабяцальнымі, з прадэманстраванай вялікай эканоміяй энергіі для задач машыннага зроку.
  • Adapteva Epiphany  (англ.) — прызначаны як супрацэсар, уключае мадэль блакнотнай памяці  (англ.) сеткі на крышталі  (англ.), падыходзіць да мадэлі праграмавання патокам інфармацыі, якая павінна падыходзіць для многіх задач машыннага навучання.
  • ComBox x64 Movidius PCIe Blade board — плата пашырэння PCI Express  (руск.) з максімальнай шчыльнасцю VPU Intel Movidius (MyriadX) для інферэнса звышдакладных нейронавых сетак у ЦАД
  • Cambricon  (англ.) Mlu100 — карта пашырэння PCI Express з ШІ-працэсарам магутнасцю 64 TFLOPS з палавіннай дакладнасцю або 128 TOPS для вылічэнняў INT8.
  • Cerebras Wafer Scale Engine  (руск.) (WSE, CS-1) — эксперыментальны суперпрацэсар кампаніі Cerebras  (руск.), змяшчае 1,2 трлн транзістараў, арганізаваных у 400 000 ШІ-аптымізаваных вылічальных ядраў і 18 Гбайт лакальнай размеркаванай памяці SRAM  (руск.) і ўсё гэта звязана ячэістай сеткай з агульнай прадукцыйнасцю 100 петабіт у секунду. Чып Cerebras ― гэта фактычна суперкамп’ютар на чыпе, дзе вылічальныя ядры SLAC (Sparse Linear Algebra Cores) ― цалкам праграмуемыя і могуць быць аптымізаваныя для працы з любымі нейроннымі сеткамі.
  • KnuPath  (англ.) — працэсар кампаніі KnuEdge  (англ.), прызначаны для працы ў сістэмах распазнання маўлення і іншых галінах машыннага навучання, ён выкарыстоўвае злучальную тэхналогію LambdaFabric і дазваляе аб’ядноўваць у адзіную сістэму да 512 тысяч працэсараў.
Nvidia Tesla  (руск.) C870.

ШІ-паскаральнікі ў выглядзе ўнутраных супрацэсараў (апаратных ШІ-блокаў)

[правіць | правіць зыходнік]
6-ядзерны SoC  (руск.) Apple A11 Bionic  (руск.) з Neural Engine  (руск.)

Навуковыя даследаванні і прадукты, якія распрацоўваюцца

[правіць | правіць зыходнік]
  • Індыйскі тэхналагічны інстытут у Мадрасе  (руск.) распрацоўвае паскаральнік на імпульсных нейронах для новых сістэм архітэктуры RISC-V  (руск.), накіраваных на апрацоўку вялікіх даных на серверных сістэмах.
  • Eyeriss  (англ.) — распрацоўка, накіравана на згорткавыя нейронныя сеткі  (руск.) з ужываннем блакнотнай памяці і сеткавай архітэктуры ў межах крышталя.
  • Fujitsu DLU  (англ.) — шматблочны і шмат’ядравы супрацэсар кампаніі Fujitsu  (руск.) які выкарыстоўвае вылічэнні з нізкай дакладнасцю і прызначаны для глыбокага машыннага навучання.
  • Intel Loihi  (англ.) — нейраморфны працэсар кампаніі Intel, які спалучае працэсы навучання, трэніроўкі і прыняцця рашэнняў у адным чыпе, дазваляючы сістэме быць аўтаномнай і «кемлівай» без падлучэння да воблака  (руск.). Напрыклад, пры навучанні з дапамогай базы дадзеных MNIST (Mixed National Institute of Standards and Technology) працэсар Loihi аказваецца ў 1 млн разоў лепш, чым іншыя тыповыя спайкавыя нейронныя сеткі.
  • Kalray  (англ.) — паказала MPPA  (англ.) і паведаміла аб павышэнні эфектыўнасці згорткавых нейронных сетак у параўнанні з GPU  (руск.).
  • SpiNNaker — масава-паралельная  (руск.) камп’ютарная архітэктура, якая спалучае ядры традыцыйнай ARM-архітэктуры  (руск.) з удасканаленай сеткавай структурай, спецыялізаванай для мадэлявання буйной нейроннай сеткі.
  • Zeroth NPU  (англ.) — распрацоўка кампаніі Qualcomm, накіраваная непасрэдна на прыўнясенне магчымасцей распазнання размовы і малюнкаў у мабільныя прылады.
  • IVA TPU — тэнзарны працэсар, над стварэннем якога працуе расійская кампанія Iva Technologies. У кастрычніку 2020 года былі апублікаваныя вынікі тэставання архітэктуры паскаральніка разліку нейронных сетак IVA TPU, праведзенага міжнародным кансорцыумам MLPerf (заснаваны ў 2018 годзе Baidu, Google, Harvard University, Stanford University, University of California, Berkeley).

Зноскі

  1. Нейропроцессор, устройство для вычисления функций насыщения, вычислительное устройство и сумматор (руск.). FindPatent.RU. Архівавана з першакрыніцы 1 снежня 2017. Праверана 17 лістапада 2017.
  2. IBM поставила LLNL нейропроцессоры TrueNorth за $1 млн (руск.). Компьютерра. (31 марта 2016). Архівавана з першакрыніцы 19 лістапада 2017. Праверана 17 лістапада 2017.
  3. Intel разрабатывает тензорные процессоры для ИИ (руск.). PC Week/RE. (22 ноября 2016). Архівавана з першакрыніцы 1 снежня 2017. Праверана 17 лістапада 2017.
  4. Подробности о тензорном сопроцессоре Google TPU (руск.). Servernews. (25 августа 2017). Архівавана з першакрыніцы 17 лістапада 2017. Праверана 17 лістапада 2017.
  5. Intel анонсировала процессор машинного зрения Movidius Myriad X (руск.). 3DNews. (29 августа 2017). Архівавана з першакрыніцы 17 лістапада 2017. Праверана 17 лістапада 2017.
  6. "Huawei создала первые в мире ИИ-процессоры, пойдя по пути разработчиков «Эльбрусов»". 23 октября 2018. Праверана 2018-10-24. {{cite news}}: Праверце значэнне даты ў: |date= (даведка)
  7. "Intel unveils purpose-built Neural Network Processor for deep learning". Tech Report. 17 октября 2017. Праверана 2017-11-17. {{cite news}}: Праверце значэнне даты ў: |date= (даведка)
  8. "Intel Nervana Neural Network Processors (NNP) Redefine AI Silicon". 17 октября 2017. Архівавана з арыгінала 20 кастрычніка 2017. Праверана 2017-11-17. {{cite news}}: Праверце значэнне даты ў: |date= (даведка) Архіўная копія(недаступная спасылка). Архівавана з першакрыніцы 20 кастрычніка 2017. Праверана 26 лютага 2023.Архіўная копія(недаступная спасылка). Архівавана з першакрыніцы 20 кастрычніка 2017. Праверана 26 лютага 2023.
  9. "Qualcomm представила ускоритель искусственного интеллекта Cloud AI 100". 10 апреля 2019. Праверана 2019-4-16. {{cite news}}: Праверце значэнне даты ў: |accessdate= і |date= (даведка)
  10. Computex: Глава Nvidia не видит угрозы в «тензорном» процессоре Google. «Открытые системы». (1 июня 2016). Архівавана з першакрыніцы 1 снежня 2017. Праверана 17 лістапада 2017.
  11. Популярность машинного обучения влияет на эволюцию архитектуры процессоров. Servernews. (31 августа 2017). Архівавана з першакрыніцы 17 лістапада 2017. Праверана 17 лістапада 2017.
  12. Что принесёт на рынок новая архитектура NVIDIA Turing?. 3DNews. (14 жніўня 2018). Архівавана з першакрыніцы 23 сакавіка 2019. Праверана 17 жніўня 2018.
  13. Эра NVIDIA Volta началась с ускорителя Tesla V100. Servernews. (11 мая 2017). Архівавана з першакрыніцы 1 снежня 2017. Праверана 17 лістапада 2017.
  14. GTC Europe 2017: библиотека NVIDIA TensoRT 3 ускоряет работу нейросетей в 18 раз по сравнению с универсальным решением. Servernews. (12 октября 2017). Архівавана з першакрыніцы 17 лістапада 2017. Праверана 17 лістапада 2017.
  15. Новый российский суперкомпьютер предназначен для обучения нейросетей. Servernews. (1 сентября 2017). Архівавана з першакрыніцы 17 лістапада 2017. Праверана 17 лістапада 2017.
  16. "AMD Announces Radeon Instinct: GPU Accelerators for Deep Learning, Coming in 2017". Anandtech. 12 декабря 2016. Праверана 12 December 2016. {{cite news}}: Праверце значэнне даты ў: |date= (даведка)
  17. "Radeon Instinct Machine Learning GPUs include Vega, Preview Performance". PC Per. 12 декабря 2016. Праверана 12 December 2016. {{cite news}}: Праверце значэнне даты ў: |date= (даведка)
  18. "The iPhone X's new neural engine exemplifies Apple's approach to AI".
  19. "Imagination представила новые ИИ-ускорители PowerVR 2NX".