Tesla P100 и Tesla V100 - графические ускорители компании Nvidia, предназначенные для выполнения задач машинного обучения и супервычислений в области искусственного интеллекта. Tesla P100 была представлена компанией в 2016 году, Tesla V100 - создана годом позже в 2017.

Что такое Nvidia Tesla P100?

Tesla P100

NVIDIA Tesla P100 работает на архитектуре Pascal. Серверы на базе Tesla P100 идеально подходят для 3D-моделирования и рабочих нагрузок глубокого обучения.

Существует 2 доступные конфигурации Tesla P100: с интерфейсом NVLink и интерфейсом PCIe. В конфигурации с NVlink на площади 610 мм² расположено 15,3 миллиарда транзисторов и 3840 CUDA ядер, распределенных между 60 потоковыми мультипроцессорами.

Технические характеристики Nvidia Tesla P100

Конфигурация с PCIe использует несколько сокращенную версию Tesla P100 с NVLink - в ней поместилось только 3584 CUDA ядер, и частота GPU стала немного меньше. NVLink обеспечивает лучшую пропускную способность (благодаря подходу CoWoS, при котором Tesla P100 объединяет процессор с HBM2 в одном блоке, обеспечивая беспрецедентный уровень эффективности вычислений), чем PCIe, за счет большего количества соединений и повышенной масштабируемости для конфигураций с несколькими GPU.

Tesla P100 стали первыми графическими ускорителями, нацеленными конкретно на супервычисления в области искусственного интеллекта. Как раз для этих задач Nvidia активно использует особенности архитектуры Tesla P100, что позволяет им достигать еще большей производительности для таких задач.

Технология Page Migration Engine, используемая Tesla P100 в для упрощения параллельного программирования, позволяет разработчикам сосредоточиться на повышении производительности вместо управления движением данных и позволяет приложениям превышать физический размер памяти GPU за счет поддержки страничной организации памяти. Технология унифицированной памяти существенно увеличивает продуктивность работы благодаря единому пространству памяти для всего узла.

Что такое Nvidia Tesla V100?

Tesla V100

Tesla V100 - следующее, после Tesla P100, поколение высокопроизводительных графических ускорителей от Nvidia. Благодаря переходу на 12 нм - техпроцесс в Tesla V100 удалось разместить 21 миллиард (на 6 миллиардов больше, чем у предшественника) транзисторов на площади 815 мм². Соответственно, количество CUDA ядер у Tesla V100 стало больше - 5120 против 3584 у Telsa P100.

Одним из главных отличий и нововведений Tesla V100 является наличие 640 тензорных ядер. Они специализируются на простых матричных перемножениях: если CUDA ядро вычисляет произведение двух чисел за один такт, то тензорное ядро за один такт производит перемножение двух матриц 4х4. Эти ядра имеют относительно небольшую сложность в реализации на транзисторах и занимают небольшую площадь на плате, но значительно повышают энергоэффективность при работе с обучением искусственного интеллекта.

Для Tesla V100 также доступны 2 модификации: с интерфейсом NVLink и с интерфейсом PCIe. Как и для Telsa P100, версия с PCIe незначительно проигрывает по производительности версии с NVLink, но, несмотря на это, версия с PCIe Tesla V100 почти в полтора раза превосходит Tesla P100 с NVLink по производительности.

NVIDIA® Tesla® V100 поставляется в конфигурациях 16 ГБ и 32 ГБ и обеспечивает производительность до 100 CPU в одном графическом процессоре.

Как представитель следующего поколения графических ускорителей, Tesla нацелена на высокопроизводительные вычисления в области искусственного интеллекта и обучении нейронных сетей. Благодаря используемой в этом GPU улучшенной версии NVLink можно более продуктивно соединить несколько ускорителей, тем самым увеличив прирост производительности.

Ускоритель Tesla V100 создан для обеспечения максимальной производительности в существующих сверхмасштабируемых дата-центрах. Один сервер, оснащенный Tesla V100 GPU и потребляющий 13 кВт энергии, обеспечивает в задачах инференса такую же производительность, как  30 CPU-серверов. Подобный скачок производительности и энергоэффективности способствует расширению масштабов применения сервисов с искусственным интеллектом.

Сравнение Tesla P100 и Tesla V100

Фундаментальные и архитектурные различия между Tesla V100 и Tesla P100 представлены в виде таблицы

Продукт Tesla Tesla V100 Tesla P100
Архитектура Volta Pascal
Кодовое имя GV100 GP100
Ядра / графический процессор 5120 3584
Частота ускорения графического процессора 1530 МГц 1480 МГц
Тензорные ядра / графический процессор 640 NA
Тип памяти HBM2 HBM2
Максимальный объем оперативной памяти 32 ГБ 16 ГБ
Тактовая частота памяти 1758 МГц 1430 МГц
Пропускная способность памяти 900,1 Гб /с 720,9 Гб/с
Поддержка CUDA начиная с версии 7.0 начиная с версии 6.0
Производительность с плавающей запятой 14 029 гфлопс 10 609 гфлопс
Частота ядра 1246 МГц 1190 МГц
Частота в режиме Boost 1380 МГц 1329 МГц
Технологический процесс 12 нм 16 нм
Скорость текстурирования 441,6 GTexel/s 297,7 GTexel/s

Tesla P100 поддерживает следующие API: DirectX 12.0 (12_1), OpenGL 4.6, OpenCL 1.2, Vulkan 1.2.131. API, поддерживаемые Tesla V100: 12.0 (12_1), OpenGL 4.6, OpenCL 2.0

Общие параметры Tesla P100 и Tesla V100, параметры, отвечающие за совместимость (с материнской платой, с корпусом, с блоком питания), а также параметры памяти говорят о производительности Tesla P100 и Tesla V100 косвенным образом.

Некоторые результаты сравнения можно увидеть на тесте cuBLAS

Cравнение Tesla P100 и Tesla V100 на тесте cuBLAS

Заключение

Возникает вопрос, что же выбрать и не переплатить? Для решения задач глубокого обучения рекомендуется использовать графические процессоры Tesla V100, которые выполняют расчеты с одинарной и двойной точностью, подходят для различных научных областей, обеспечивают высокую абсолютную производительность и оптимально сочетают цены и производительность для ИИ.

Графический ускоритель Tesla P100 также отвечает высоким вычислительным запросам благодаря хорошей производительности и эффективности графической архитектуры NVIDIA Pascal™. Он позволяет создавать «суперузлы», пропускная способность которых превышает пропускную способность 32 узлов на базе CPU и сокращает капитальные и операционные расходы до 70%.

Анализируя результаты тестов можно сказать что на практике разница заметна только на очень больших данных и что обе карты предназначены для очень масштабных и дорогостоящих вычислений специализированных датацентров.

Приобрести серверное оборудование, включая видеокарты NVIDIA Tesla, по доступной цене можно, обратившись в нашу компанию. Наши специалисты помогут вам подобрать качественное серверное оборудование в нужной конфигурации и проконсультируют вас по всем возникшим вопросам.