Тенденции и перспективы развития СуперЭВМ

Объем памяти каждого узла — до 128GB, производительность обменов с памятью достигает 1TB/sec. Система может включать до 32 узлов, обеспечивая совокупную пиковую производительность до 4 TFlop/s.

Для связи узлов используется высокоскоростной коммутатор (IXS Internode Crossbar Switch).

Используется операционная система SUPER-UX.

Поставляются компилятор языка HPF, реализация интерфейса MPI, компиляторы Fortran77/SX и Fortran90/SX с автоматическим распараллеливанием и векторизацией, а также интегрированная среда разработки и оптимизации PSUITE.

Fujitsu VPP

Производитель Fujitsu

Класс архитектуры параллельный векторный суперкомпьютер (PVP).

Модификации VPP300, VPP700, VPP5000

Каждый процессорный элемент (PE) системы VPP700E состоит скалярного устройства (SU), векторного устройства (VU), блока памяти и устройства сопряжения. Для VPP700: VU состоит из 7 конвейеров и обеспечивает пиковую производительность до 2.4 GFLOP/sec. Объем памяти — до 2GB. Для VPP5000: VU состоит из 4 конвейеров, пиковая производительность — 9.6 GFLOP/sec. Объем памяти — до 16GB.

Для VPP700: cистема может включать от 8 до 256 PE, суммарная пиковая производительность до 14.4 GFLOP/sec Для VPP5000: до 512 PE, суммарная пиковая производительность до 4.9 TFLOP/sec.

Процессорные элементы связаны коммутатором (crossbar network), который производить двухсторонние обмены, не прерывая вычислений. Пропускная способность каналов коммутатора: для VPP700 — 615MB/sec, для VPP5000 — 1.6GB/sec. Используется операционная система UXP/V, основанная на UNIX System VR4.

Среди средств разработки поставляются: распараллеливающий и векторизующий компилятор Fortran90/VPP, оптимизированная для VPP библиотека математических подпрограмм SSLII/VPP, библиотеки передачи сообшений MPI-2 и PVM 3.3.

AlphaServer

Производитель Compaq, Digital.

Высокопроизводительный SMP-сервер, AlphaServer Array — кластерная система.

Процессоры GS140 и GS60 — Alpha 21 264, 8400 и 8200 — Alpha 21 164

Число процессоров GS140 и 8400 — до 14, GS60 и 8200 — до 6

Объем памяти GS140 — до 28GB.

Кластеры AlphaServer Array могут объединять до 8 узлов AlphaServer, т. е. в общей сложности до 112 процессоров. Могут комбинироваться узлы различных типов. Узлы связываются между собой коммутатором MEMORY CHANNEL, который обеспечивает скорость обменов до 66MB/sec и латентность порядка 3 мкс.

На платформе AlphaServer поддерживаются операционные системы Tru64 UNIX (это новое имя Digital UNIX), OpenVMS и Windows NT. Поставляется ПО кластеризации TruCluster Software.

Используются коммуникационные библиотеки TruCluster MEMORY CHANNEL Software и MPI. Поддерживается распараллеливание в стандарте OpenMP.

Особо выдающимися характеристиками отличаются суперкомпьютеры в конце 90-х годов предстиавлены в таблице 3.

Таблица 3 — наиболее быстродействующие суперекомпьютеры

Изготовитель

Суперкомпьютер

Страна

Год создания

Число процессоров

Пиковая производи-тельность, Гфлопс

Реальная производи-тельность на пакете LINPAK, Гфлопс

1

Intel

ASCI Red

USA

1999

9472

3154

2121.3

2

SGI

ASCI Blue Mountain

USA

1998

6144

3072

1608

3

SGI

T3E1200

USA

1998

1084

1300.8

891.5

4

Hitachi

SR8000/128

Japan

1999

128

1024

873.6

5

SGI

T3E900

USA

1997

1324

1191.6

815.1

6

SGI

ORIGIN2000

USA

1999

2048

1024

690.9

7

SGI

T3E900

UK

1997

876

788.4

552.92

8

IBM

SP Silver

USA

1998

1952

1296

547

9

SGI

T3E900

USA

1999

812

730.8

515.1

10

SGI

T3E1200

UK

1998

612

734

509.9

11

IBM

ASCI Blue Pacific CTR SP Silver

USA

1998

1344

892

468.2

12

Hitachi

SR8000/64

Japan

1999

64

512

449.7

Классификация параллельных вычислительных систем, предложенная Т. Джоном, основана на разделении МВС по двум критериям: способу построения памяти (общая или распределенная) и способу передачи информации. Основные типы машин по классификации Т. Джона представлены в таблице 1. Здесь приняты следующие обозначения: p- элементарный процессор, M — элемент памяти, K- коммутатор, С — кэш-память.