Тенденции и перспективы развития СуперЭВМ

Таблица 3 — наиболее быстродействующие суперекомпьютеры

Изготовитель

Суперкомпьютер

Страна

Год создания

Число процессоров

Пиковая производи-тельность, Гфлопс

Реальная производи-тельность на пакете LINPAK, Гфлопс

1

Intel

ASCI Red

USA

1999

9472

3154

2121.3

2

SGI

ASCI Blue Mountain

USA

1998

6144

3072

1608

3

SGI

T3E1200

USA

1998

1084

1300.8

891.5

4

Hitachi

SR8000/128

Japan

1999

128

1024

873.6

5

SGI

T3E900

USA

1997

1324

1191.6

815.1

6

SGI

ORIGIN2000

USA

1999

2048

1024

690.9

7

SGI

T3E900

UK

1997

876

788.4

552.92

8

IBM

SP Silver

USA

1998

1952

1296

547

9

SGI

T3E900

USA

1999

812

730.8

515.1

10

SGI

T3E1200

UK

1998

612

734

509.9

11

IBM

ASCI Blue Pacific CTR SP Silver

USA

1998

1344

892

468.2

12

Hitachi

SR8000/64

Japan

1999

64

512

449.7

Классификация параллельных вычислительных систем, предложенная Т. Джоном, основана на разделении МВС по двум критериям: способу построения памяти (общая или распределенная) и способу передачи информации. Основные типы машин по классификации Т. Джона представлены в таблице 1. Здесь приняты следующие обозначения: p- элементарный процессор, M — элемент памяти, K- коммутатор, С — кэш-память.

Параллельная вычислительная система с общей памятью и шинной организацией обмена (машина 1) позволяет каждому процессору системы «видеть», как решается задача в целом, а не только те части, над которыми он работает. Общая шина, связанная с памятью, вызывает серьезные проблемы для обеспечения высокой пропускной способности каналов обмена. Одним из способов обойти эту ситуацию является использование кэш-памяти (машина 2). В этом случае возникает проблема когерентности содержимого кэш-памяти и основной. Другим способом повышения производительности систем является отказ от центральной памяти (машина 3).

Таблица 1 — Классификация МВС по типам памяти и передачи сообщений

Типы передачи

Типы памяти

Сообщений

Общая память

Общая и распределенная

Распределенная память

Шинные соединения

1.

2.

3.

Фиксированные перекрестные соединения

4.

5.

6.

Коммутационные структуры

7.

8.

9.

Идеальной машиной является вычислительная система, у которой каждый процессор имеет прямые каналы связи с другими процессорами, но в этом случае требуется чрезвычайно большой объем оборудования для организации межпроцессорных обменов. Определенный компромисс представляет сеть с фиксированной топологией, в которой каждый процессор соединен с некоторым подмножеством процессоров системы. Если процессорам, не имеющим непосредственного канала обмена, необходимо взаимодействовать, они передают сообщения через промежуточные процессоры. Одно из преимуществ такого подхода — не ограничивается рост числа процессоров в системе. Недостаток — требуется оптимизация прикладных программ, чтобы обеспечить выполнение параллельных процессов, для которых необходимо активное воздействие на соседние процессоры.

Наиболее интересным вариантом для перспективных параллельных вычислительных комплексов является сочетание достоинства архитектур с распределенной памятью и каналами межпроцессорного обмена. Один из возможных методов построения таких комбинированных архитектур — конфигурация с коммутацией, когда процессор имеет локальную память, а соединяются процессоры между собой с помощью коммутатора (машина 9). Коммутатор может оказаться весьма полезным для группы процессоров с распределяемой памятью (машина 8). Данная конфигурация похожа на машину с общей памятью (машина 7), но здесь исключены проблемы пропускной способности шины.

Основным недостатком классификации Т. Джона является скрытие уровня параллелизма в системе, а, как уже было сказано выше параллелизм любого рода требует одновременной работы, по крайней мере, двух устройств.

Такими устройствами могут быть:

  • арифметико-логические устройства (АЛУ)
  • устройства управления (УУ).

В ЭВМ классической архитектуры УУ и АЛУ образуют процессор. Увеличение числа процессоров или числа АЛУ в каждом из них приводит к соответствующему росту параллелизма. Наличие в ЭВМ нескольких процессоров означает, что одновременно (параллельно) могут выполняться несколько программ или несколько фрагментов одной программы. Работа нескольких АЛУ под управлением одного УУ означает, что множество данных может обрабатываться параллельно по одной программе. В соответствии с этим описание структур параллельных систем можно представить в виде упорядоченной тройки:

<k, d, w>,

где k — количество устройств управления, т. е. наибольшее количество независимо и одновременно выполняемых программ в системе;

d — количество АЛУ, приходящихся на одно устройство управления;