Nhà phát triển | National Supercomputing Center in Wuxi, Vô Tích, Giang Tô |
---|---|
Nhà chế tạo | NRCPC |
Dòng sản phẩm | Sunway |
Ngày ra mắt | thàng 6 năm 2016 |
Giá giới thiệu | 1,8 tỉ Nhân dân tệ (US$273 million) |
Hệ điều hành | Sunway RaiseOS 2.0.5 (trên nền Linux) |
CPU | 1,45 GHz (3.06 TFlops single CPU, 105 PFLOPS LINPACK, 125 PFLOPS peak) |
Bộ nhớ | 1,32 PB (5591 TB/s total bandwidth) |
Lưu trữ | 20 PB |
Năng lượng | 15 MW (LINPACK) |
Mục đích | Oil prospecting, life sciences, weather forecast, industrial design, pharmaceutical research[cần dẫn nguồn] |
---|---|
Trang web | http://www.nsccwx.cn/wxcyw/ |
Sunway TaihuLight (tiếng Trung, Shénwēi · tàihú zhī guāng) là một siêu máy tính của Trung Quốc. Tính đến tháng 11 năm 2018[cập nhật], được xếp thứ ba trong danh sách TOP 500,[1] với điểm đo hiệu suất LINPACK là 93 petaflop.[2][3] Tốc độ này nhanh gấp gần ba lần so với siêu máy tính Thiên Hà 2 trước đó.[4] Được thiết kế bởi Trung tâm nghiên cứu quốc gia về kỹ thuật và công nghệ máy tính song song (NRCPC) và được đặt tại Trung tâm siêu máy tính quốc gia Vô Tích thuộc thành phố Vô Tích, tỉnh Giang Tô, Trung Quốc.[2][5]
Sunway TaihuLight từng là siêu máy tính nhanh nhất thế giới từ tháng 6 năm 2016 đến tháng 6 năm 2018, theo danh sách TOP 500. Kỷ lục đã bị vượt qua vào tháng 6 năm 2018 bởi siêu máy tính Summit của IBM.[1][5][6]
Sunway TaihuLight sử dụng tổng cộng 40.960 bộ vi xử lí SW26010 64-bit RISC dựa trên kiến trúc Sunway.[7] Mỗi chip xử lý chứa 256 lõi xử lý và thêm bốn lõi phụ để quản lý hệ thống, tổng số 10.649.600 lõi vi xử lí trên toàn hệ thống.[8]
Hệ thống này chạy trên hệ điều hành riêng của mình, Sunway RaiseOS 2.0.5, dựa trên Linux.[7] Hệ thống sử dụng OpenACC 2.0 tùy chỉnh riêng để hỗ trợ quá trình mã hóa song song.[9]
Each CPE Cluster is composed of a Management Processing Element (MPE) which is a 64-bit RISC core which is supporting both user and system modes, a 256-bit vector instructions, 32 KB L1 instruction cache and 32 KB L1 data cache, and a 256KB L2 cache. The Computer Processing Element (CPE) is composed of an 8×8 mesh of 64-bit RISC cores, supporting only user mode, with a 256-bit vector instructions, 16 KB L1 instruction cache and 64 KB Scratch Pad Memory (SPM). [..] Each CPE has a 64 KB local (scratchpad) memory, no cache memory. The local memory is SRAM. There is a 16KB instruction cache. Each of the 4 CPE/MPE clusters has 8 GB of DDR3 memory. So a node has 32 GB of primary memory. Each processor connects to four 128-bit DDR3-2133 memory controllers, with a memory bandwidth of 136.51 GB/s.
The TOP500 report said that the chip also lacks any traditional L1-L2-L3 cache, and instead has 12KB[sic] of instruction cache and 64KB "local scratchpad" that works sort of like an L1 cache.