Серверы, используемые при решении задач линейной алгебры и машинного обучения (инференса и прогнозирования) для рекуррентных нейронных сетей, должны обладать высокой отказоустойчивостью, широким функционалом и хорошей производительностью. Всем этим требованиям отвечает Supermicro SYS-1029GQ-TVRT - сервер форм-фактора 1U, оснащенный двумя процессорами Intel Xeon Scalable, материнской платой X11DGQ, блоками питания 2x 2000W (Titanium) и SATA до 2 штук с возможностью горячей замены
Обзор SUPERMICRO SYS-1029GQ-TVRT
Сервер оснащен двумя процессорами 1 и 2 поколения Intel Xeon Scalable, которые представлены широким модельным рядом, от Bronze до Platinum. Каждый из этих процессоров оснащается шестью слотами DDR4 DIMM, что позволяет обеспечивать поддержку технологии Optane DCPMM (Optane PMem 100) ёмкостью до 512 Гб, что позволяет вместе с DRAM довести полный объём системной памяти до 6 Тб. Еще одним преимуществом процессоров Intel Xeon заключается в технологии Intel Deep Learning Boost с векторными командами нейронной сети, в разы повышающую производительность логических выводов искусственного интеллекта.
У материнской платы X11DGQ есть одна особенность - ею поддерживаются процессоры с TDP до 205 Вт; при этом для самой платформы TDP поддерживаемых процессоров находится в пределах от 70 до 165 Вт. Это означает, что некоторые высокочастотные процессоры серии Intel Gold (6144, 6146, 6244, 6246, 6250 и 6256) с данной материнской платой не совместимы. В X11DGQ предусмотрены внутренние секции под хранение и ввод-вывод, а также функции подсоединения SATA на передней панели и подсоединения RAID-контроллера непосредственно к материнской плате.
Блок питания Supermicro PSU, Titanium, 2000W, hot swap PWS-2K05A-1R, используемый в представленном сервере, высокопроизводителен и безопасен. Эффективная система охлаждения, компактные размеры и возможность горячей замены делают это устройство оптимальным комплектующим для Supermicro.
Установленный в сервере SATA 3 (6 Гбит/с) с RAID 0, 1, 5, 10 обеспечивает более высокую частоту и минимизацию задержек, показывает улучшенное управление питанием устройства и ускоренный обмен данными в работе с SSD (для жестких дисков SATA 3 не подходит).
Фронтальная и задняя панели устройства имеют довольно простой и понятный принцип работы.
На передней панели с правой стороны размещены кнопка Power Button - подающая/отключающая запитку сервера (при включении основного источника питания резервное сохраняется) и кнопка UID Button (включение светодиодов). Сигналы светодиодов означают:
- красный - перегрев;
- мигающий красный (1Hz) - проблемы в работе систем охлаждения;
- мигающий красный (0.25Hz) - нарушения в системе питания;
- мигающий синий - активация UID из IPMI для визуального обнаружения сервера в стойке;
- NIC1 LED - сетевая активность для 1 порта;
- NIC1 LED - сетевая активность для 1 порта;
- NIC2 LED - сетевая активность для 2 порта;
- HDD LED - жесткие диски активны;
- Power LED - подача питания.
Фронтальная панель также оснащена двумя 2,5-дюймовыми слотами, которые предназначены для SATA3/SAS3 (для установки SAS-дисков необходимы вспомогательные компоненты). На выдвигаемом шильдике выше дисковых слотов находится пароль от IPMI.
На задней панели располагаются:
- задние порты I/O - VGA port, Dedicated IPMI LAN, USB0 (3.0), USB1 (3.0), USB2 (3.0), USB3 (3.0), LAN2 (10GbE), LAN1 (10GbE), Unit Identifier Switch (UID);
- низкопрофильный слот расширения PCI-Express 3.0 x8 LP (для CPU2) и два полноразмерных слота расширения PCI-Express 3.0 x16 FHHL (для CPU1 и CPU2);
- два блока питания: PWS-706P-1R (1U 750W redundant power width 54.5mm (Platinum), HF, RoHS/REACH, PBF).
Технические характеристики
Технические характеристики Supermicro SYS-1029GQ-TVRT представлены в таблице.
Функциональность | Технические характеристики |
Форм-фактор | Стоечный сервер форм-фактора 1U |
Процессор | 1-2 поколение Intel® Xeon® Scalable |
Количество ядер процессора | до 28 |
Видеокарты и ускорители |
до 4-ёх NVIDIA Tesla V100 32GB SXM2 Volta, до 4-ёх NVIDIA Tesla P100 16GB SXM2 Pascal |
Память | До 6 TB (12 слотов DIMM, DDR4-2933 МГц, поддержка Intel Optane DCPMM |
Чипсет | Intel® C621 |
Система BIOS | AMI 32Mb SPI Flash ROM |
Контроллеры RAID | SATA3 (6Gbps) with RAID 0, 1, 5, 10M |
Слоты расширения | 4 слота PCI-E 3.0 x16 |
Удалённое администрирование | Модуль удаленного администрирования Supermicro Intelligent Management |
Сетевая карта | Intel X540 Dual Port 10GBASE-T |
Жёсткие диски | до 2-ух SAS/SATA накопителей возможностью горячей замены |
Блок питания | в комплекте 2 блока питания Supermicro 2000W (Titanium) |
Габариты | Высота 1,7" (43 мм); Ширина 17,2" (437 мм); Глубина 35,2" (894 мм) или 39,3" (997 мм) с направляющими |
Управление ПО осуществляется через диспетчер узлов Intel, IPMI 2.0, KVM с выделенной локальной сетью, NMI, SSM, SPM, SUM, SuperDoctor5 и Watch Dog. За управление питанием отвечает ACPI/APM.
Изюминка SUPERMICRO SYS 1029GQ
Для ускорения машинного обучения, работы с графикой и data science в системах, базирующихся на Supermicro SYS, в этих серверах используются графические процессоры с тензорными ядрами и ядрами CUDA - Tesla P100 и Tesla V100.
NVIDIA TESLA P100 SXM2
Ускоритель P100 применяется чаще всего в создании удаленных рабочих мест, в которых задействуются ресурсоемкие приложения (например, для 3D-графики или транскодинга видео).
Минимальная тактовая частота работы этой карты - 1328 MHz, а при переходе в турборежим ее можно разогнать до 1480 МГц. Оперативная память составляет 16 ГБ при частоте 1408 МГц, скорость полосы пропускания - 720,9 ГБ/с. В данной карте размещено 15,300 млн транзисторов (3584 CUDA ядер), что обеспечивает поддержку 16-nm технологического процесса и 10,609 gflops операций с плавающей запятой.
NVIDIA TESLA V100 SXM2
Tesla V100 принадлежит к следующему поколению GPU, поэтому производительность этих графических ускорителей стала намного выше, достигнув 15,7 терафлопс на операциях с одинарной точностью.
Это обусловлено переходом на 12-nm технологический процесс, увеличением количества транзисторов до 21 миллиарда и числа CUDA ядер до 5120. Tesla V100 применяется в обучении нейронных сетей и в высокопроизводительных вычислениях (HPC) в различных сферах ИИ. При этом, благодаря большей производительности, эти процессы осуществляются гораздо быстрей и эффективней.
Так, Tesla V100 показывает лучшие результаты при решении задач линейной алгебры и машинного обучения (инференса и прогнозирования) для рекуррентных нейронных сетей с долгой краткосрочной памятью. Это связано с большей приспособленностью тензорных ядер к умножению матричных блоков со смешанной точностью, а также с лучшим увеличением Tesla V100 скрытых слоев и с уменьшением точности вычислений. Во всех случаях тестирование проводилось с использованием одной карты, но, по утверждению разработчиков, объединение нескольких GPU даст максимальные результаты ускорения.
Как Tesla P100, так и Tesla V100 существуют в двух конфигурациях: с интерфейсом NVLink и интерфейсом PCIe.
Стандарт PCIe подходит для решения задач большинства вычислительных систем; однако в серверах с несколькими графическими процессорами, работающими параллельно на перемещение значительных объемов данных, карта с PCIe может перегрузиться и стать «узким местом» в производительности.
Устранить такую проблему помогает переход на интерфейс NVLink с мезонинным разъемом SXM 2. Такая схема предусматривает установку сверхскоростного энергоэффективного соединения между процессором и GPU, а также между несколькими графическими процессорами с максимальным потенциалом производительности. Это означает, что NVLink поддерживает передачу данных в моменты пиковых нагрузок на скорости 300 ГБ/с по одному из выбранных маршрутов (не через центральный концентратор связи, а через сетку с высокой пропускной способностью).
Таким образом, серверы, оптимизированные под NVLink, обеспечивают наилучшую производительность и гибкое масштабирование для центров обработки данных, работающих с приложениями HPC и глубокого машинного обучения.
Кому подойдет Supermicro SYS: область применения
Сервер Supermicro SuperServer 1029GQ-TVRT оптимален при решении задач линейной алгебры и машинного обучения (инференса и прогнозирования) для рекуррентных нейронных сетей.
Если вам необходимо приобрести представленное оборудование, обращайтесь к специалистам нашей компании. Мы подберем требуемую конфигурацию сервера Supermicro SuperServer SYS-1029GQ-TVRT под любые задачи.