Суперкомпьютерный кластер:

шаг вперед для науки и промышленности

Одна из технологий, связанных с искусственным интеллектом — высокопроизводительные вычисления (HPC). Увеличение сложности задач требует мощных вычислительных ресурсов и быстрых сетевых соединений. Плюсом становится и способность системы масштабироваться вместе с увеличением объемов вычислений. Для решения таких задач компания К2 НейроТех проектирует и создает суперкомпьютеры.

Рынок HPC сегодня

Высокопроизводительные системы — это комплекс, используемый для работы с высокими вычислительными нагрузками (High Performance Computing, HPC). Высокопроизводительные кластеры способны обрабатывать данные и выполнять сложные расчеты с высокой скоростью за счет параллельного запуска тысяч вычислительных узлов. Кластеры активно применяют для задач обработки больших данных, задач искусственного интеллекта и математического моделирования.
До недавнего времени высокопроизводительные кластеры использовали в основном в области науки и исследований.

Высоконагруженные системы понимаются в широком смысле — они включают в себя все кластеры для НРС на GPU и CPU, самые мощные из них могут являться суперкомпьютерами, однако, такие машины единичны.
Сегменты ИТ-рынка, которые формируют целевой рынок
Hardware: - Вычислительная техника - Сеть и коммуникации
Services: - Системная интеграция - Техническая поддержка
Software: - Инфраструктурное ПО - Операционные системы - Средства разработки - ИБ
Оъем и динамика рынка НРС-кластеров on-premise
В 2022 году объем рынка сократился, однако на фоне снижения большинства сегментов ИТ-рынка на 20% и более этот рынок упал на 10,5%. Причиной стали сокращение сегмента hardware из-за ухода крупнейших западных вендоров и неготовнось российских потребителей массово внедрять отечественные аппаратные комплексы.
Рост рынка на 20,7% в 2023 году отчасти обусловлен восстановлением после 2022 года, но более важным долгосрочным драйвером рынка стал бум генеративного ИИ, для обучения и инференса которого используются НРС.

15,8 млрд — так оценивается объем рынка в 2024 году. Более 70% этого рынка приходится на оборудование для кластеров, менее 10% — на ПО.

Сокращение и рост рынка

-10,5%2022
+20,7%2023
+32,7%2024
+44,7%2025

Организации начали пересматривать возможности применения алгоритмов искусственного интеллекта в целом и увеличивать инвестиции в эту сферу. Искусственный интеллект становится основным драйвером роста рынка и коммодизации технологии. НРС on-premise выходят за границы стандартных кейсов применения, связанных с научными вычислениями и моделированием.
Роль услуг повышается по мере импортозамещения: клиентам нужны совместимые работоспособные кластеры на отечественном оборудовании

Как HPC применяется в промышленности и науке

Главные заказчики HPC — это организации, которым нужно производить сложные и ресурсоемкие вычисления: университеты, НИИ, промышленные, нефтегазовые, сервисные компании, финансовый бизнес, операторы связи, метеорологические центры.

В коммерческом сегменте высокоскоростные вычисления нужны для работы с большими данными: их используют государственные службы, ритейлеры, крупные интернет-компании и другие предприятия.

Возможность анализировать данные с высокой скоростью и точностью открывает новые перспективы для научных исследований — например, моделирования климатических изменений, изучения геномов, расчета сложных формул или симуляции сложных физических процессов.

В частности, суперкомпьютер Frontier, который считается одним из самых мощных в мире, применяют для исследования космоса, изучения черных дыр, моделирования изменений климата. Frontier разработала и создала компания Hewlett Packard. Он установлен в Национальной лаборатории Окриджа в США.
Японский Fugaku, входящий в десятку самых мощных суперкомпьютеров, учат прогнозировать наводнения и цунами. Он создает обучающие данные для ИИ — например, смоделировал серию из 20 000 цунами с разными формами волн и их последствиями на суше. На этих данных ученые обучили ИИ, в результате чего создали модель, умеющую прогнозировать мощность и последствия цунами, которую можно запустить на обычном ПК.
В промышленности HPC позволяет оптимизировать процессы, моделировать производство, разрабатывать новые материалы, проверять наличие брака в продукции и повышать эффективность систем управления.

В частности, в Сколково работает вычислительный кластер «Олег», названный в честь князя Олега. Он позволяет предсказывать свойства новых технологически важных материалов — сверхтвердых, магнитных, термоэлектрических, сверхпроводящих. Такие материалы нужны, например, для бурения, энергетики, развития сверхскоростного транспорта.

В каждой отрасли есть запрос, для которого необходима инфраструктура, выполняющая задачи параллельных вычислений.

Что нужно, чтобы внедрить HPC

Для успешного внедрения HPC необходимы несколько ключевых элементов:

Ситуация на российском рынке суперкомпьютеров

До недавних пор известные западные производители (HPE, Dell, Lenovo и другие) предлагали суперкомпьютеры как моновендорные решения в отлаженных конфигурациях. Эти решения включали все необходимые аппаратные и программные компоненты.
Однако в настоящее время возможности поставок ограничены — и в первую очередь это затронуло вычислительные узлы с графическими ускорителями и решения по построению интерконнекта для высокоскоростной сети. Кроме того, из-за ухода привычных вендоров экспертизы по суперкомпьютерам стало меньше. Опыт создания систем на основе доступного на рынке оборудования есть у немногих.
В результате заказчикам необходимо по-новому учиться строить и эксплуатировать HPC-кластеры. Нужно искать и новые пути поддержки уже внедренных решений: масштабировать построенные на западных решениях суперкомпьютеры практически невозможно. В таких случаях остается только находить сервисных партнеров для сопровождения имеющихся кластеров и проектировать новые на отечественных решениях.

HPC от К2 НейроТех —
что это такое

Российская компания К2 НейроТех разработала высокопроизводительный программно-аппаратный комплекс для ресурсоемких задач.
Этот кластер отвечает требованиям регуляторов и пожеланиям заказчиков: в нем используются решения, соответствующие требованиям импортозамещения.
На уровне аппаратного обеспечения, который включает вычислительные узлы (с использованием как CPU, так и GPU), высокоскоростной интерконнект и узлы хранения данных, компания старается задействовать отечественные компоненты.
Программное обеспечение — операционная система, службы планирования очередей и управления кластером, параллельная файловая система — тоже включает отечественные продукты и СПО с доработками компании.

Преимущества для бизнеса

Инжиниринг

01
В сфере инжиниринга суперкомпьютерные кластеры К2 НейроТех позволяют проводить моделирование свойств инженерных конструкций, транспортных средств и их компонентов, а также виртуальные испытания. Это ускоряет разработку и повышает надежность проектных решений.

Машиностроение

02
В машиностроении моделирование и анализ транспортной инфраструктуры в густонаселенных районах способствуют принятию обоснованных решений, оптимизируя логистику и безопасность движения.

Фармацевтика
и медицина

03
В фармацевтике и медицине моделирование свойств новых медицинских препаратов и их взаимодействия с организмом помогает ускорить процесс разработки лекарств и повысить их эффективность и безопасность.

Образование
и наука

04
В сфере образования и науки использование суперкомпьютеров для исследования новых материалов и моделирования природно-климатических процессов открывает новые возможности для научных открытий и образовательных программ.

Добывающая
промышленность

05
В добывающей промышленности гидродинамическое моделирование добычи, а также моделирование энергопотребления обеспечивают оптимизацию процессов освоения месторождений. Использование цифровых двойников с технологиями IIoT повышает точность и безопасность операций, снижая затраты.

Что предлагает К2 НейроТех бизнесу

Инфраструктуру кластера HPC от К2 НейроТех можно оптимизировать под уникальные рабочие нагрузки для конкретных задач. В программно-аппаратный комплекс (ПАК) входят удобные инструменты для настройки и управления HPC-средой. Благодаря этому процесс интеграции и эксплуатации кластера становится максимально простым и понятным.

Аппаратный слой

В аппаратном слое характеристики ПАКа обеспечивают высокую производительность, гибкость конфигурации, совместимость и масштабируемость.
Производительность до 7,6 TFLOPS (FP64) на сервер, поддержка оперативной памяти до 8ТБ DDR5 и высокоскоростные сети Mellanox Infiniband и Ethernet до 100 Гбит/с позволяют значительно ускорить моделирование и научные расчеты, сокращая время на выполнение задач и повышая продуктивность.
Высокая пропускная способность памяти и сетей обеспечивает быструю обработку и передачу данных, что минимизирует задержки и повышает производительность системы.
Конфигурация под задачи клиента дает возможность адаптировать систему к конкретным требованиям, обеспечивая совместимость с текущей инфраструктурой и соответствие корпоративной политике и бюджету.

Собирать суперкомпьютер можно из различных компонентов (Intel, AMD, NVIDIA и других). Кроме того, система масштабируется: при проектировании ПАКа закладывается возможность расширения вычислительных мощностей по мере роста потребностей бизнеса, не требуя значительных первоначальных инвестиций.

Программный слой

На программном слое преимущества ПАК-HPC от К2 НейроТех — это прозрачность и контроль, импортонезависимость, удобство и совместимость.
Прозрачность обеспечивают системы мониторинга Zabbix и XDMoD. Постоянный контроль за состоянием кластера позволяет своевременно выявлять и устранять проблемы, гарантируя стабильную работу.
Использование российских и Open source технологий обеспечивает независимость от западных поставщиков, устойчивость к внешним ограничениям — и, как следствие, стабильность и безопасность.
Удобный API и web-интерфейс предоставляет поддержку любых дистрибутивов Linux и простые инструменты для создания и управления задачами.
Совместимость с существующей ИТ-инфраструктурой делает систему более доступной и удобной в использовании.
При этом компания разрабатывает индивидуальные решения: кластер создается «под ключ» с учетом типа нагрузки. Систему можно адаптировать под специфические требования заказчика, чтобы обеспечить максимальную эффективность.
За безопасность отмечают технологии обеспечения ИБ (LDAP, FreeIPA), управление нагрузкой и оркестрация (Slurm, NOVA). Надежная защита данных и эффективное управление задачами повышают безопасность и производительность системы.

Тестирование и обслуживание

Для оптимальной настройки проводится тестирование системы. Оно гарантирует, что система будет работать под реальными нагрузками эффективно и надежно, снижая риски и повышая производительность.
После развертывания компания обеспечивает плановое и гарантийное обслуживание всех компонентов системы, включая системное ПО и ПО промежуточного слоя.
Срок гарантии составляет три года.
Постгарантийное обслуживание позволяет оперативно решать возникающие проблемы и обеспечивает долговременную надежность системы после окончания гарантийного периода.

Успешный опыт

Уже развернутые суперкомпьютеры компании эффективно выполняют свои задачи. Так, суперкомпьютер «Оракул» в Центре Национальной технологической инициативы (НТИ) по новым функциональным материалам на базе Новосибирского государственного университета ускоряет разработку новых типов материалов и проектирование на их основе изделий для промышленных предприятий.

В отсутствие «простого» решения HPC-кластер собирали с нуля. Эксперты компании подобрали конфигурацию и спроектировали архитектуру суперкомпьютера под конкретный запрос Центра НТИ и с учетом требования — ориентироваться на решения, обеспечивающие технологический суверенитет. HPC-кластер возвели в лабораторных условиях в Москве, протестировали компоненты на совместимость и на возможность работы под предельными нагрузками в режиме 24/7.


После отладки кластера команда К2 НейроТех доставила его из Москвы в Новосибирск, развернула в дата-центре на базе НГУ и провела запуск и наладку. Также была отстроена инфраструктура для стабильной и бесперебойной работы кластера.
Эксперты К2 НейроТех развернули суперкомпьютер на 11 узлах. Вычислительная подсистема — это 392 процессорных ядра в семи высокопроизводительных серверах.
За обмен данными между серверами отвечает первый российский интерконнект «Ангара», разработанный в «НИЦЭВТ». Номинальная скорость передачи данных — не менее 75 Гбит/c. Прогнозируемая пиковая производительность суперкомпьютера — не менее 47 Тфлопс. Вместимость отказоустойчивого NFS-хранилища — не менее 40 Тбайт данных.
Среда виртуализации на основе платформы zVirt отечественного разработчика Orion soft обеспечивает эффективную утилизацию вычислительных мощностей серверов.
Суперкомпьютер позволяет сотрудникам ЦНФМ сократить время на выполнение сложных математических расчетов в среднем в 10-12 раз и таким образом повысить количество выполняемых вычислений в месяц.
Этот проект команды К2 НейроТех победил в конкурсе «Проект года» Global CIO и занял второе место на премии CIPR Digital в 2024 году.
erid: LjN8KC4W9
Рекламодатель: АО "К2 ИНТЕГРАЦИЯ"
ИНН/ОГРН: 7701829110/01097746072797
Сайт: https://k2int.ru/

статьи

Как приручить ИИ: 3 возможных сценария внедрения

Читать

Олег Вишняк, К2 НейроТех: Объем рынка высокопроизводительных систем вырос на 35% из-за бума ИИ

Читать

ПАК-ML для обучения ИИ-моделей: что необходимо для нейросетей и обработки Big Data?

Читать

От развлечения к глобальной трансформации: как искусственный интеллект меняет рынок

Читать
На главную