Supermicro представила решения DCBBS Blueprints для NVIDIA Vera Rubin NVL72 и NVIDIA HGX Rubin NVL8, масштабируемые от 5 МВт до 1 ГВт
Компания Super Micro Computer, Inc., поставщик комплексных ИТ-решений для ИИ, облачных вычислений, систем хранения данных и инфраструктуры 5G/Edge, представила эталонные решения (Blueprints) для центров обработки данных (Data Center Building Block Solutions, DCBBS) на платформах NVIDIA Vera Rubin NVL72 и NVIDIA HGX Rubin NVL8. Новые эталонные решения предназначены для создания центров обработки данных ИИ гигаваттного масштаба; в их основе лежит масштабируемый вычислительный блок с 1152 графическими процессорами (GPU), который можно тиражировать практически без ограничений. DCBBS Blueprints от Supermicro предусматривают проектирование и поставку полного комплекса оборудования и услуг с участием специальной команды экспертов, сопровождающей весь жизненный цикл внедрения. DCBBS обеспечивают необходимые вычислительные ресурсы, системы хранения данных, сетевую инфраструктуру, передовые технологии жидкостного охлаждения, распределение электропитания и инфраструктуру объекта, позволяя ускорить ввод в эксплуатацию крупных ИИ-фабрик с жидкостным охлаждением.

«Платформа NVIDIA Vera Rubin NVL72 задает новый стандарт производительности ИИ-фабрик, а наши эталонные решения DCBBS Blueprints предоставляют заказчикам проверенный комплексный путь к созданию инфраструктуры любого масштаба — от 5 МВт до 1 ГВт, — сказал Чарльз Лян (Charles Liang) президент и генеральный директор компании Supermicro. «Мы реализовали одни из самых ранних и крупнейших ИИ-фабрик с жидкостным охлаждением, и этот опыт заложен в каждое эталонное решение, поэтому наши клиенты могут пройти путь от проектирования до полностью функционирующего объекта быстрее, чем когда-либо прежде».
DCBBS Blueprints от Supermicro решают практические задачи внедрения самой современной в мире инфраструктуры для искусственного интеллекта. Платформа NVIDIA Vera Rubin существенно повышает плотность производительности ИИ-фабрик, обеспечивая двукратную скорость быстродействия по нескольким вычислительным направлениям. Новейшая эталонная архитектура NVIDIA точно определяет состав идеального масштабируемого блока с 1152 графическими процессорами, а эталонные решения DCBBS Blueprints от Supermicro описывают практические шаги по его успешному внедрению с опорой на подтвержденный опыт реализации крупнейших в мире ИИ-фабрик с жидкостным охлаждением и количеством GPU, превышающим 100.000.
DCBBS Blueprints от Supermicro решает практические задачи внедрения ИИ-фабрик
Компании, планирующие строительство новых ИИ-фабрик или модернизацию существующих объектов, начинают с главного ограничения: доступной мощности электропитания. DCBBS Blueprints для NVIDIA Vera Rubin NVL72 включают сбалансированную спецификацию оборудования для диапазона мощности от 5 МВт до 1 ГВт и обеспечивают оптимальное соотношение между охлаждением, энергоснабжением, вычислительными узлами, узлами управления, высокопроизводительными системами хранения данных, узлами платформы хранения контекстной памяти и сетевой инфраструктуры. Это позволяет избежать узких мест, связанных с перегрузкой сети, ограничениями энергопотребления, тепловым троттлингом и другими факторами, сдерживающими производительность.
Эталонные решения Blueprints охватывают полный цикл работ, который Supermicro успешно использует для реализации масштабных проектов ИИ рекордными темпами:
- Выездные обследования площадки проводятся командой специалистов Supermicro для анализа физических параметров объекта с точки зрения требований к будущему развертыванию. В ходе обследования проверяются доступность зон разгрузки, размеры и свободные пространства машинных залов, планировка помещений, допустимые нагрузки на перекрытия и другие характеристики объекта. Площадка также оценивается на предмет существующей перспективной инфраструктуры электроснабжения и охлаждения, что позволяет сформировать проектное предложение Supermicro, адаптированное под конкретный объект заказчика.
- Проектный дизайн и предложения включают все критически важные детали будущего развертывания и формируются с учетом требований заказчика и специфики объекта. Supermicro определяет оптимальную комбинацию компонентов DCBBS, включая систему охлаждения (рядные CDU мощностью до 1,8 МВт для объектов с полной поддержкой прямого жидкостного охлаждения; системы «жидкость-воздух» для объектов без инфраструктуры водяного охлаждения; варианты CDU, интегрируемые в стойку (для конфигураций на базе стоек 52U, в настоящее время находятся в стадии разработки); теплообменники задней двери для эксплуатации в условиях повышенной температуры окружающей среды). Заказчики получают полный комплект проектной документации, прозрачную ведомость материалов и детализированный график развертывания.
- Интеграция решения с полным комплектом услуг на площадке заказчика: Процесс интеграции решений Supermicro начинается задолго до поставки оборудования на объект, причем большая часть тяжелой работы выполняется на производственных площадках Supermicro в США. Сюда входит монтаж оборудования в стойки, установка компонентов и прокладка кабельной проводки. Supermicro проводит функциональное тестирование, превышающее отраслевые стандарты, включая проверки уровня системы (L10) и многосерверных кластеров (L11). Команда специалистов Supermicro также координирует поставку и интеграцию компонентов уровня объекта, включая CDU, градирни и энергетическую инфраструктуру, а также взаимодействует со сторонними подрядчиками по выбору заказчика. Услуги по интеграции и интеграция на площадке включают установку стоек, подключение питания и охлаждения, прокладку сетевых кабелей, ввод системы в эксплуатацию, установку стека программного обеспечения и валидацию решения на месте.
- Поддержка, услуги и программное обеспечение предоставляют широкий спектр возможностей для долгосрочного успеха, включая выезд специалистов на объект (с реагирования до 4 часов для критически важных инфраструктур). Поддерживается интеграция с программным комплексом управления инфраструктурой Supermicro, включая решения SuperCloud Composer® и SuperCloud Director, которые обеспечивают централизованное управление всей инфраструктурой, от серверов без операционной системы до оркестрации рабочих нагрузок в многоарендных средах; также поддерживается полный программный стек NVIDIA для ИИ, включая NVIDIA AI Enterprise и NVIDIA Run:ai. Функции учета активов обеспечивают доступ к информации о физических активах и данных датчиков для каждого CDU и других компонентов.
Решения DCBBS Blueprints от Supermicro согласуются с эталонной архитектурой для платформы NVIDIA Vera Rubin NVL72
Платформа NVIDIA Vera Rubin обеспечивает потенциал революционного роста производительности следующего поколения, однако для ее успешного внедрения необходим воспроизводимый и надежный подход. Supermicro гарантирует согласованность платформы с новейшей эталонной архитектурой NVIDIA, что дает заказчикам уверенность в совместимости инфраструктуры с экосистемой NVIDIA Cloud Partner.
Масштабируемые блоки, лежащие в основе эталонных решений Supermicro DCBBS Blueprints, включают 1152 графических процессора NVIDIA Rubin с 331 ТБ памяти GPU HBM4. Поколение Vera Rubin удваивает пропускную способность памяти GPU, пропускную способность NVLink от GPU к GPU и сетевую пропускную способность на каждый GPU по сравнению с платформой NVIDIA Blackwell, создавая архитектурную основу для обучения и вывода моделей пограничного ИИ с несколькими триллионами параметров.
- Усовершенствованная технология прямого жидкостного охлаждения (DLC-2), включая градирни мощностью 5 МВт, 4 шт рядных распределительных блоков охлаждения (до 1,8 МВт каждый), 16 шт вертикально установленных распределительных коллекторов охлаждения и 576 шт медных холодных пластин с прямым подключением к чипу (по 1 на каждый модуль главного процессора). Используется охлаждающая жидкость Supermicro SMC PG25-A, разработанная для обеспечения исключительной химической и термической стабильности. Для поддержки развертывания Vera Rubin NVL72 на объектах без инфраструктуры жидкостного охлаждения предусмотрены решения « жидкость-воздух», включая вариант мощностью 200 кВт для одной стойки и вариант мощностью 500 кВт для двух стоек.
- Инфраструктура распределения электропитания охватывает всю цепочку — от трансформаторов среднего напряжения до низковольтного распределения, силовых модулей стоек и блоков резервного питания (BBU). Каждая стойка Vera Rubin NVL72 включает в себя четыре полки питания мощностью по 110 кВт с резервируемыми блоками питания мощностью 18,3 кВт. Портфель DCBBS поддерживает ЦОДы критического назначения и предусматривает использование систем накопления энергии Supermicro (Battery Energy Storage System, BESS) с мгновенным переключением на резервное питание.
- Стоечные шкафы 48U и 52U для высокоплотных систем прямого жидкостного охлаждения.
- 16 вычислительных стоек, оптимизированные для платформ NVIDIA Vera Rubin NVL72 и NVIDIA HGX Rubin NVL8.
- 6 сетевых стоек (4 вычислительные, 2 конвергентные) для поддержки NVIDIA Spectrum-X Ethernet или NVIDIA Quantum-X800 InfiniBand с пропускной способностью до 1,6 TБ/с. Будущая поддержка кремниевой фотоники и совместно упакованной оптики (CPO) для оптимизации эксплуатационных затрат, повышения энергоэффективности и отказоустойчивости без подключаемых приемопередатчиков.
- 4 высокопроизводительных стойки для систем хранения данных на серверной платформе Supermicro Petascale для NVMe-накопителей, контрольных точек обучения моделей и других задач.
2 стойки платформы хранения контекстной памяти, оптимизированные для задач референса с длинным контекстом, агентной рабочей памяти и рабочих нагрузок извлечения.