О кластере
Гибридный вычислительный кластер — это группа вычислительных узлов различной архитектуры, объединенных высокоскоростными каналами связи. С точки зрения пользователя гибридный вычислительный кластер представляет собой единую вычислительную систему. Основное предназначение вычислительного кластера — выполнение большого количества расчетов.
Кластер КФУ состоит из следующих основных компонентов:
- Управляющий узел — это многопроцессорный сервер, который управляет ресурсами вычислительного кластера, организует работу очередей заданий, осуществляет мониторинг компонентов вычислительного кластера и выполняет ряд других вспомогательных функций.
Задача:
- Универсальные вычислительные узлы с x86_64 архитектурой — это многопроцессорные, многоядерные сервера на которых выполняются задачи пользователя. Задача пользователя может занимать несколько вычислительных узлов вплоть до целого кластера.
Задачи:
- Вычислительные узлы Big Data – это многопроцессорные, многоядерные сервера с увеличенным локальным пространством для обработки больших данных.
Задачи:
- Узлы с графическими процессорами – многопроцессорные сервера с дополнительно установленными модулями ускорения вычислений GPU NVIDIA.
Задачи расчётов в области фундаментальных наук, таких как:
- Система хранения данных (СХД) предназначена для организованного хранения данных и обеспечения высокоскоростного параллельного доступа к ним.
- Коммуникационная сеть обеспечивает коммуникации между процессами параллельных приложений на вычислительных узлах с использованием протокола MPI (Message Passing Interface), а также доступ узлов к СХД. Управляющий и вычислительные узлы, объединенные в локальную сеть на основе технологии Infiniband, которая обеспечивает пропускную способность 56 Gbit/s.
- Транспортная и сервисная сети предназначены для обеспечения служебных коммуникаций между всеми узлами вычислительного кластера и построены на основе технологии Gigabit Ethernet.
- Программное обеспечение - Кластер работает под управлением ПО IBM Platform HPC (планировщик заданий, мониторинг системы, MPI, средства конфигурирования и развертывания узлов, web-портал).
В качестве операционной системы на всех узлах используется OC RedHat for HPC.