#benchmarki

Обзор процессоров Intel Ice Lake Xeon-W vs AMD TR Pro. Тестирование и сравнение результатов производительности

Купить ПК с процессорами AMD TR Pro и Intel Ice Lake Xeon-W

В августе 2021 года в массовые продажи поступили процессоры Intel Xeon-W. Они созданы для однопроцессорных рабочих станций и направлены на профессиональную деятельность. Производятся они по 10-нм технологическому процессу. В этой линейке представлено 5 моделей, они насчитывают до 38 ядер, а частота составляет до 4 ГГц при разгоне. Линейка создавалась в качестве конкурента для AMD TR Pro.

Threadripper Pro – в сущности гораздо более быстрая вариация AMD EPYC, которая применяется в однопроцессорных рабочих станциях. Серия TR Pro представлена 4 моделями, которые имеют от 12 до 64 ядер. А теперь давайте разберемся, что же такого особенного в этих процессорах. Действительно ли Intel Xeon-W – конкурент для AMD TR Pro? О чем говорят тесты? Ответы на эти вопросы содержатся в данной статье. После ее прочтения вам будет легче определиться, какая из моделей подойдет под ваши задачи.

 

 

Содержание:

  1. Вступление
  2. Особенности Intel Ice Lake Xeon-W
  3. Характеристика AMD TR Pro
  4. Сравнение технических параметров
  5. Результаты тестов
    1. HPL Linpack
    2. HPCG
    3. NAMD
    4. Numpy
  6. Вывод
  7. Где можно купить сборки с процессорами Intel Ice Lake Xeon-W и AMD TR Pro?

 

 

Вступление

 

Intel Xeon-W 3300 – улучшенная платформа с более быстрой 8-канальной памятью увеличенной емкости и PCIe 4.0 с большим количеством линий. Сам процессор существенно улучшен и имеет новые возможности, такие как Intel Deep Learning Boost. Новая платформа Intel очень похожа на платформу AMD Threadripper Pro. 

Чтобы понять, кто из них показывает лучшую производительность, были проведены тесты с четырех точек зрения. Один из них HPL (linpack) – это основной показатель производительности, используемый для ранжирования мощных ПК в списке Top500. Тест HPCG – хорошее представление о рабочих нагрузках, связанных с памятью. Моделирование молекулярной динамики NAMD – хорошее приложение для «реального мира». 

Numpy – это библиотека для Python. Она применяется настолько широко, что Numpy API стал стандартным интерфейсом API, включенным в большую часть фреймворков численных вычислений Python, то есть TensorFlow, PyTorch, PAX и прочие. На CPU он очень часто чувствителен к выбору библиотеки BLAS. Результаты тестов приведены для Xeon-W и TR Pro с Intel oneMKL и OpenBLAS.

 

 

Особенности Intel Ice Lake Xeon W

 

В течение некоторого времени у Intel были 28-ядерные процессоры, но с этим поколением у пользователей появляется множество новых функций, а также возможность увеличения числа ядер. Вот некоторые улучшения серии Xeon-W-3300:

  1. Улучшение памяти. Поддержка 8-канальной DDR4-3200 вместо 6-канальной DDR4-2933 с поддержкой памяти ЕСС. Также можно установить объем до 4 ТБ.
  2. Улучшение PCIe. Поддержка PCIe Gen4, а также наличие 64 канала PCIe Gen4 сравнительно с 48 полосами PCIe Gen3. 
  3. Новый DLBoost и AI Inference.
  4. Обновлен комплекс микросхем до Intel C621A, который используется совместно с серией Ice Lake Xeon.
  5. Более высокий TDP до 270 Вт. 
  6. Больший диапазон ядер, поддерживаемых в сокете.

 

В целом у него множество новых функций, которых не было в Cascade Lake предыдущего поколения. Посмотрев видео ниже, вы сможете узнать еще некоторые особенности процессоров линейки Xeon-W-3300. 

 

 

Характеристика AMD TR Pro

 

Threadripper Pro – идеальные инструменты для художников, архитекторов, инженеров и они оснащены функциями, которые разработаны для самых требовательных профессиональных нагрузок. TR Pro владеет практически всеми возможностями платформы AMD EPYC, однако TDP составляет 280 Вт. Он нацелен на конкуренцию с Intel Xeon-W. 

AMD TR Pro располагает 8 канальной памятью DDR4-3200, а линий PCIe 4.0 насчитывается 128 и поддерживает ЕСС. Одним отрицательным нюансом EPYC является то, что он применим лишь в однопроцессорных системах, а максимальная поддержка памяти снижена в 2 раза (с 4 ТБ до 2 ТБ). У него лучшая многопоточная и однопоточная производительность. TR Pro имеет достаточно высокие рабочие частоты, а также они выделяются пакетом специальных функций – AMD PRO Security, PRO Manageability, PRO Business Ready, а еще обладает функцией полного шифрования памяти Memory Guard. 

 

 

Сравнение технических параметров

 

Чтобы легче было ориентироваться в характеристиках этих процессоров, в таблице мы привели основные из них.

 

Модель Intel Xeon W-3375 Intel Xeon W-3365 Intel Xeon W-3345 AMD TR Pro 3995WX AMD TR Pro 3975WX
Техпроцесс 10-нм 10-нм 10-нм 7-нм 7-нм
Число ядер и потоков 38/76 32/64 24/48 64/128 32/64
Частота максимум 4 4 4 4,2 4,2
Кэш L3 57 48 36 256 128
Количество линий PCIe 4.0 64 64 64 128 128
TDP 270 Вт 270 Вт 250 Вт 280 Вт 280 Вт

 

А теперь к самому главному – тесты производительности.

 

 

Результаты тестов

 

Как уже говорилось выше, тесты проводились с четырех точек зрения. Ниже приведены результаты этих тестов. 

 

HPL Linpack

HPL Linpack – это стандартная мера оптимизированной производительности вычислений с плавающей запятой. Он хорошо использует векторные блоки (AVX) и библиотеки BLAS. 

Для систем Intel Xeon использовалась многопоточная сборка Linpack OpenMP из текущей библиотеки oneMKL. А для систем AMD использовалась оптимизированная двоичная сборка HPL, поставляемая с библиотекой AMD BLISv2-3. 

На фото видно, что Intel Ice Lake Xeon-W c 32 ядрами и 38 ядрами превзошли даже AMD TR Pro, у которого 64 ядра. Threadripper 3990X и Pro 3995WX показали практически одинаковые результаты. Это было ожидаемо для этого теста, так как «вычислительное» ядро очень похожее. Xeon имеет существенное преимущество от векторного модуля AVX-512 и высокооптимизированной библиотеки MKL (BLAS). 

 

HPCG

Это требовательный тест, который ограничен производительностью подсистемы памяти. Он был разработан как дополнение к HPL, чтобы дать лучший индикатор производительности систем HPC. 

Ice Lake Xeon очень хорошо справляется с этим тестом благодаря 8-канальной памяти, доступной в новой линейке. TR Pro 3995WX работает значительно лучше, чем TR 3990X в этом тесте, потому что у Pro 8 каналов памяти, у обычной версии их 4. Двойная система EPYC очень похожа на две модели TR Pro 3995WX. Она имеет в общей сложности 16 каналов памяти. Что же касается производительности процессоров Xeon Ice Lake 8352Y и 6258R, она существенно выше, потому что у них 16 и 12 каналов памяти. 

 

NAMD

NAMD – широко применяемая программа молекулярной динамики с превосходной параллельной масштабируемостью и низкой зависимостью от специально оптимизированных аппаратных библиотек, например, MKL. Это хороший тест параллельной производительности как для CPU, так и для GPU.

Задания для тестов:

  • ApoA1 приблизительно 92 тыс. атомов;
  • STMV приблизительно 1 млн. атомов.

 

NAMD имеет очень хорошее ускорение видеокарты, поэтому скорее всего вы захотите включить графический процессор в свою систему. Для версии 2.х NAMD необходим хороший баланс между возможностями процессора и видеокарт. Обычно это означает использование системы ЦП с большим числом ядер и 1 или 2 видеокартами NVIDIA.  

Количество ядер является основным ограничивающим фактором для выполнения этого задания. NAMD отлично маштабируется на CPU. На самом деле значительно лучше он работает, когда применяется Hyper Threading или SMT. Хотя для некоторых высокопроизводительных приложений это не так. Когда включено ускорение видеокарты, HT либо SMT замедляют работу.

В STMV производительность памяти имеет большое значение. 

Здесь и Intel Xeon AMD, и CPU чувствуют себя хорошо, и любой из них предлагает отличную платформу для NAMD, особенно когда включены видеокарты NVIDIA.

 

Numpy

Python Numpy занимает главное место в большей части работы, выполняемой в области машинного обучения и научных вычислений с помощью Python. Он используется внутри многих пакетов, и API принимается/включается в качестве стандартного интерфейса для частей фреймворков машинного обучения, таких как TensorFlow, PyTorch, JAX, и есть варианты, такие как NVIDIA CuPy, которые работают с ускорением видеокарты, включая упомянутые ранее фреймворки.

Базовая библиотека BLAS, связанная с Numpy, важна для производительности. Распространение Anaconda Python, ориентированное на машинное обучение данным, по умолчанию связывает свою numpy-сборку с Intel MKL. В прошлом OpenBLAS обеспечивал хорошую производительность на процессорах AMD. Последние выпуски Intel MKL (oneMKL) теперь включает правильный оптимизированный кодовый путь для процессоров AMD.

В таблице приведены тесты линейной алгебры Numpy, сравнивающих 38-ядерный Xeon-W 3375 и 64-ядерный TR Pro 399WX. Здесь вы можете сравнить версии, чтобы увидеть разницу. Например, Numpy 1.19 с MKL 2020.2 используется для TR Pro в сборке Anaconda, чтобы показать, на что была похожа производительность со старым MKL. Сборка Intel Numpy практически такая же, как сборка Anaconda, и вы можете увидеть эффект более оптимального пути кода для AMD с новым MKL.

Ожидания оправдались, 38-ядерный Intel Xeon-W 3375 отлично справляется с Numpy, связанным с MKL. Он достаточно сильно превосходит TR Pro 3995WX с 64 ядрами. Сборка OpenBLAS плохо справилась с Intel. Новая сборка Intel такая же хорошая, равно как и openBLAS для TR Pro, благодаря лучшему пути кода для AMD в последних версиях MKL.  

 

 

Вывод

 

Существует много рабочих нагрузок рабочих станций, которые продвигают поддержку AVX-512 и DL Boost, поэтому для многих Intel будет надежным вариантом. Всего лишь несколько месяцев назад у AMD не было большой конкуренции в этой сфере. Теперь у Intel появился законный конкурент по более широкому спектру процессоров – серия Xeon-W-3300.

Intel Ice Lake Xeon-W – очень хорошие ЦП, которые отлично подходят для вычислительных нагрузок, оптимизированных под Intel. Большая часть тестов показала, что как 32-ядерный, так и 38-ядерный CPU Ice Lake работают лучше, чем даже 64-ядерный TR Pro. Все результаты тестов определенно в пользу Intel, потому что, за исключением NAMD, они имели сильно оптимизированные сборки для Intel. 

Если вы работаете с программами, оптимизированными для Intel (с MKL), новый Ice Lake Xeon – очевидный выбор. Инструменты разработчика Intel oneAPI превосходны, поэтому в целом эту платформу и экосистему Ice Lake Xeon легко рекомендовать. Однако, если вы не работаете в экосистеме Intel, AMD TR Pro также очень хороший вариант процессора и отличная платформа. 

Касательно общих возможностей платформы, процессоры сильно похожи. Если вы используете инструменты Intel, то лучше выбрать Intel. В другом случае оба процессоры отличный вариант. 

 

 

Где можно купить сборки с процессорами Intel Ice Lake Xeon W и AMD TR Pro

 

Если вам необходима рабочая станция с процессором Intel Ice Lake Xeon-W или AMD TR Pro, тогда в магазине Артлайн вы можете посмотреть уже готовые сборки или мы соберем устройство под ваши потребности с одним из них (если таких сборок еще нет, значит, они скоро появятся на сайте). У нас вы можете приобрести любое устройство в рассрочку под 0%. Оплатить покупку можно любым удобным для вас способом. Доставка по всей территории Украины. Обращайтесь! Мы будем рады подобрать для вас устройство под ваши задачи!

 

г. Киев, ул. Кирилловская, 104

  • (080) 033-10-06
  • (044) 338-10-06
  • (066) 356-10-01
  • (097) 356-10-01
  • (063) 356-10-01

[email protected]