Тенденции и перспективы развития СуперЭВМ
Таблица 3 — наиболее быстродействующие суперекомпьютеры
№ | Изготовитель | Суперкомпьютер | Страна | Год создания | Число процессоров | Пиковая производи-тельность, Гфлопс | Реальная производи-тельность на пакете LINPAK, Гфлопс |
1 | Intel | ASCI Red | USA | 1999 | 9472 | 3154 | 2121.3 |
2 | SGI | ASCI Blue Mountain | USA | 1998 | 6144 | 3072 | 1608 |
3 | SGI | T3E1200 | USA | 1998 | 1084 | 1300.8 | 891.5 |
4 | Hitachi | SR8000/128 | Japan | 1999 | 128 | 1024 | 873.6 |
5 | SGI | T3E900 | USA | 1997 | 1324 | 1191.6 | 815.1 |
6 | SGI | ORIGIN2000 | USA | 1999 | 2048 | 1024 | 690.9 |
7 | SGI | T3E900 | UK | 1997 | 876 | 788.4 | 552.92 |
8 | IBM | SP Silver | USA | 1998 | 1952 | 1296 | 547 |
9 | SGI | T3E900 | USA | 1999 | 812 | 730.8 | 515.1 |
10 | SGI | T3E1200 | UK | 1998 | 612 | 734 | 509.9 |
11 | IBM | ASCI Blue Pacific CTR SP Silver | USA | 1998 | 1344 | 892 | 468.2 |
12 | Hitachi | SR8000/64 | Japan | 1999 | 64 | 512 | 449.7 |
Классификация параллельных вычислительных систем, предложенная Т. Джоном, основана на разделении МВС по двум критериям: способу построения памяти (общая или распределенная) и способу передачи информации. Основные типы машин по классификации Т. Джона представлены в таблице 1. Здесь приняты следующие обозначения: p- элементарный процессор, M — элемент памяти, K- коммутатор, С — кэш-память.
Параллельная вычислительная система с общей памятью и шинной организацией обмена (машина 1) позволяет каждому процессору системы «видеть», как решается задача в целом, а не только те части, над которыми он работает. Общая шина, связанная с памятью, вызывает серьезные проблемы для обеспечения высокой пропускной способности каналов обмена. Одним из способов обойти эту ситуацию является использование кэш-памяти (машина 2). В этом случае возникает проблема когерентности содержимого кэш-памяти и основной. Другим способом повышения производительности систем является отказ от центральной памяти (машина 3).
Таблица 1 — Классификация МВС по типам памяти и передачи сообщений
Типы передачи | Типы памяти | ||||
Сообщений | Общая память | Общая и распределенная | Распределенная память | ||
Шинные соединения | 1. | 2. | 3.
| ||
Фиксированные перекрестные соединения | 4. | 5. | 6. | ||
Коммутационные структуры | 7. | 8. | 9. |
Идеальной машиной является вычислительная система, у которой каждый процессор имеет прямые каналы связи с другими процессорами, но в этом случае требуется чрезвычайно большой объем оборудования для организации межпроцессорных обменов. Определенный компромисс представляет сеть с фиксированной топологией, в которой каждый процессор соединен с некоторым подмножеством процессоров системы. Если процессорам, не имеющим непосредственного канала обмена, необходимо взаимодействовать, они передают сообщения через промежуточные процессоры. Одно из преимуществ такого подхода — не ограничивается рост числа процессоров в системе. Недостаток — требуется оптимизация прикладных программ, чтобы обеспечить выполнение параллельных процессов, для которых необходимо активное воздействие на соседние процессоры.
Наиболее интересным вариантом для перспективных параллельных вычислительных комплексов является сочетание достоинства архитектур с распределенной памятью и каналами межпроцессорного обмена. Один из возможных методов построения таких комбинированных архитектур — конфигурация с коммутацией, когда процессор имеет локальную память, а соединяются процессоры между собой с помощью коммутатора (машина 9). Коммутатор может оказаться весьма полезным для группы процессоров с распределяемой памятью (машина 8). Данная конфигурация похожа на машину с общей памятью (машина 7), но здесь исключены проблемы пропускной способности шины.
Основным недостатком классификации Т. Джона является скрытие уровня параллелизма в системе, а, как уже было сказано выше параллелизм любого рода требует одновременной работы, по крайней мере, двух устройств.
Такими устройствами могут быть:
- арифметико-логические устройства (АЛУ)
- устройства управления (УУ).
В ЭВМ классической архитектуры УУ и АЛУ образуют процессор. Увеличение числа процессоров или числа АЛУ в каждом из них приводит к соответствующему росту параллелизма. Наличие в ЭВМ нескольких процессоров означает, что одновременно (параллельно) могут выполняться несколько программ или несколько фрагментов одной программы. Работа нескольких АЛУ под управлением одного УУ означает, что множество данных может обрабатываться параллельно по одной программе. В соответствии с этим описание структур параллельных систем можно представить в виде упорядоченной тройки:
<k, d, w>,
где k — количество устройств управления,
d — количество АЛУ, приходящихся на одно устройство управления;