Intel официально представляет процессоры Sapphire Rapids и HPC
Тиффани Трейдер
10 января 2023 г.
После ряда задержек Intel выпустила масштабируемый процессор Intel Xeon четвертого поколения под кодовым названием Sapphire Rapids, преемник Ice Lake. Платформа, изготовленная на узле Intel 7 (ранее известном как 10-нм) и имеющая до 60 ядер Golden Cove на процессор плюс новые выделенные ядра-ускорители, обеспечивает средний прирост производительности в 1,53 раза по сравнению с предыдущим поколением и среднюю производительность на ватт эффективности в 2,9 раза. По данным Intel, улучшение целевых рабочих нагрузок с использованием новых ускорителей.
Запуск, состоявшийся сегодня в рамках глобальной прямой трансляции, также включал недавно переименованные процессоры и графические процессоры серии Max, которые ранее назывались «Sapphire Rapids HBM» и «Ponte Vecchio» соответственно.
Семейство Sapphire Rapids включает 52 SKU (см. таблицу), сгруппированных в 10 сегментов, включая серию Max: 11 оптимизированы для работы с двумя процессорами (от 8 до 56 ядер, 150–350 Вт), 7 — для производительности с двумя процессорами ( от 12 до 36 ядер, 150–300 Вт), 10 целевых четырех- и восьмипроцессорных процессоров (от 8 до 60 ядер, 195–350 Вт) и 3 оптимизированных части для одного процессора (от 8 до 32 ядер, 125–250 Вт). ). Существуют также SKU, оптимизированные для облачных, сетевых, хранилищ, мультимедиа и других рабочих нагрузок.
В линейку SKU серии Xeon Max, оптимизированной для HPC, входят 32-, 40-, 48-, 52- и 56-ядерные версии. Максимальная мощность всех пяти двухпроцессорных процессоров составляет 350 Вт, а цена по прейскуранту варьируется от 7995 долларов США за 32-ядерный процессор 9462 до 12 980 долларов США за 56-ядерный процессор 9480. Есть две модели, которые дороже серии 9480 Max: 60-ядерный процессор. Core 8490H, который стоит 17 000 долларов, и 48-ядерный 8460H за 13 923 доллара.
На пресс-конференции в Хиллсборо, штат Орегон, в прошлом месяце старший научный сотрудник Intel Ронак Сингхал упомянул широкий спектр SKU, сказав: «Клиенты скажут, что у вас слишком много SKU. Можете ли вы, ребята, уменьшить количество SKU, но можете ли вы добавить? эти три SKU действительно очень важны? Так что у нас есть такая возможность с нашими клиентами».
Новые возможности масштабируемых процессоров Intel Xeon четвертого поколения включают PCIe 5.0, память DDR5 и поддержку CXL 1.1.
56-ядерный двухпроцессорный процессор 8480+ с верхним расположением процессоров (без HBM) — с на 40 % больше ядер, чем его аналог из Ice Lake — добился прироста производительности по сравнению с поколением в ряде тестов, показав результат в 1,5 раза. улучшение Stream Triad, улучшение в 1,4 раза для HPL и улучшение в 1,6 раза для HPCG. Тестирование Intel в более чем дюжине реальных приложений (включая WRF, Black Scholes, Monte Carlo и OpenFoam) показало одинаковое ускорение, с наибольшим приростом для физической нагрузки — CosmoFlow (2,6x).
ЦП серии Max — это первый процессор x86 со встроенной памятью с высокой пропускной способностью. По данным Intel, она обеспечивает прирост производительности в 3,7 раза для рабочих нагрузок, связанных с памятью, и требует на 68 процентов меньше энергии, чем «развернутые конкурирующие системы». В приложении AlphaFold2 процессор Xeon Max показал трехкратное ускорение по сравнению с процессором Ice Lake в тестировании Intel. Примечательный для наблюдателей за производительностью HPC процессор серии Max обеспечивает почти 2,4-кратное ускорение HPCG и 3,5-кратное ускорение Stream Triad по сравнению с эквивалентом Sapphire Rapids, поддерживающим только DDR. HBM в ЦП серии Max не обеспечил улучшения производительности в тесте High Performance Linpack.
Графический процессор Ponte Vecchio серии Max, также представленный сегодня, содержит более 100 миллиардов транзисторов в корпусе из 47 ячеек и до 128 ядер Xe HPC. В зависимости от форм-фактора он поддерживает до 128 ГБ памяти HBM2e и обеспечивает пиковую производительность до 52 терафлопс FP64. Согласно результатам сравнительного анализа, проведенного Intel, сочетание графического процессора серии Max с платформой ЦП серии Max (в соотношении графический процессор: процессор три к одному) обеспечивает прирост производительности в 12,9 раз для рабочих нагрузок молекулярной динамики LAMMPS по сравнению с платформой Ice Lake без графических процессоров. Добавление графических процессоров Max (шесть графических процессоров, добавленных к серверу с двумя процессорами) привело к увеличению производительности в 9,9 раз по сравнению с платформой серии Max, состоящей только из процессоров, для той же рабочей нагрузки. Память с высокой пропускной способностью на центральных процессорах позволила повысить производительность в 1,55 раза по сравнению с использованием только DDR5. (Фото демонстрации, проведенной в Хиллсборо, штат Орегон, в прошлом месяце.)