Гибридный вычислительный кластер — это группа вычислительных узлов различной архитектуры, объединенных высокоскоростными каналами связи. С точки зрения пользователя гибридный вычислительный кластер представляет собой единую вычислительную систему. Основное предназначение вычислительного кластера — выполнение большого количества расчетов.

Кластер КФУ состоит из следующих основных компонентов:


- Управляющий узел — это многопроцессорный сервер, который управляет ресурсами вычислительного кластера, организует работу очередей заданий, осуществляет мониторинг компонентов вычислительного кластера и выполняет ряд других вспомогательных функций.

Задача:

- Универсальные вычислительные узлы с x86_64 архитектурой — это многопроцессорные, многоядерные сервера на которых выполняются задачи пользователя. Задача пользователя может занимать несколько вычислительных узлов вплоть до целого кластера.

Задачи:

- Вычислительные узлы Big Data это многопроцессорные, многоядерные сервера с увеличенным локальным пространством для обработки больших данных.

Задачи:

- Узлы с графическими процессорами – многопроцессорные сервера с дополнительно установленными модулями ускорения вычислений GPU NVIDIA.

Задачи расчётов в области фундаментальных наук, таких как:

- Система хранения данных (СХД) предназначена для организованного хранения данных и обеспечения высокоскоростного параллельного доступа к ним.


- Коммуникационная сеть обеспечивает коммуникации между процессами параллельных приложений на вычислительных узлах с использованием протокола MPI (Message Passing Interface), а также доступ узлов к СХД. Управляющий и вычислительные узлы, объединенные в локальную сеть на основе технологии Infiniband, которая обеспечивает пропускную способность 56 Gbit/s.


- Транспортная и сервисная сети предназначены для обеспечения служебных коммуникаций между всеми узлами вычислительного кластера и построены на основе технологии Gigabit Ethernet.


- Программное обеспечение - Кластер работает под управлением ПО IBM Platform HPC (планировщик заданий, мониторинг системы, MPI, средства конфигурирования и развертывания узлов, web-портал).


В качестве операционной системы на всех узлах используется OC RedHat for HPC.