В начале этого месяца компания Arm провела Tech Day, на котором обсуждались технологии нового поколения. Откровенно говоря, было затронуто много тем. Для читателей STH, интересующихся процессорными технологиями Arm нового поколения, в презентациях Arm Tech Day 2021 было много того, о чем мы собираемся рассказать. Мы также понимаем, что у нас много читателей-практиков, желающих оценить, что они могут приобрести. Сегодняшние анонсы больше ориентированы на будущие продукты, чем на сегодняшние, а точнее, являются частями общего пакета, необходимого для создания будущих процессоров. Поэтому на первой странице мы дадим краткую информацию, а на последующих страницах перейдем к более подробному изложению. Если вы читаете перспективные статьи STH просто для того, чтобы быть в курсе событий, не стесняйтесь пролистать первую страницу, и мы будем давать ссылки на соответствующие фрагменты, когда они станут актуальными в будущих материалах STH.
Arm Neoverse N2 и V1 на Arm Tech Day 2021: Обзор
Прежде всего, необходимо выровнять ситуацию. Компания Arm создает IP для своих процессоров. Затем этот IP лицензируется партнерам, которые берут IP Arm, добавляют к нему IP сторонних производителей или создают свои собственные продукты. Возвращаясь к другим экосистемам, можно сказать, что Arm обсуждает те части своего IP, которые будут конкурировать с AMD EPYC 7004 Genoa, Intel Xeon Sapphire Rapids и, возможно, в некоторых небольших сегментах с IBM POWER10. С учетом сказанного, вот текущая дорожная карта Arm Neoverse.
Основные выводы: у Arm есть платформа E1 для ядер с низким энергопотреблением и более высокой эффективностью, серия V для высокой производительности на ядро или менее эффективных ядер, а также серия N, которая находится посередине, но ближе к V1. Мы часто обсуждаем процессоры в терминах EPYC, Xeons, Ampere Altra (Max), AWS Graviton и других. Важно помнить, что существует гораздо больший (и, возможно, более интересный) рынок, поскольку 5G создает новые требования к инфраструктуре и новые потребности в безопасности/сетевой обработке. Отличным примером этого является DPU. У нас уже есть много DPU на STH, а также несколько карт NVIDIA BlueField-2 для будущего материала. В презентации Arm изображение сетевой карты Marvell Octeon SmartNIC показалось мне отличным примером того, как меняется форма вычислений. Когда ваша сетевая карта работает под управлением дистрибутива Linux, например Ubuntu, и имеет независимую адресацию, парадигма вычислений меняется.
С этой целью Arm инвестирует в ряд технологий и в несколько направлений для развития своей экосистемы. Опять же, чем больше Arm сможет расширить свою экосистему, тем больше IP она лицензирует, поэтому, когда мы слышим, как Intel обсуждает OneAPI для своей стратегии xPU (некоторые из них работают на ядрах Arm), мы должны помнить, что Arm должна сделать то же самое и даже больше для своих партнеров по экосистеме.
Частью этого проекта является Project Cassini. Это попытка компании Arm повысить уровень стандартизации среди своих партнеров. Возможно, это не остановит Apple от создания собственного дизайна M1, но создание стандартов поможет в принятии решений на начальном этапе. Многие забывают о том, что многие устройства, не относящиеся к центрам обработки данных, используются в течение многих лет. Одна из областей, в которой x86 показывает отличные результаты, — это возможность поддержки устройств, которые используются уже десять лет и более. Если у вас есть система Intel Xeon серии 5500, вы можете установить и запустить на ней Ubuntu без каких-либо дополнительных работ или поддерживать ее в актуальном состоянии. В экосистеме Arm это часто называют поддержкой устаревшего кода, но мы также должны помнить, что не все являются телефонами, настольными компьютерами или серверами. Кроме того, не у всех есть финансовые возможности обновляться каждые 3-5 лет. Конечным результатом проекта Cassini является повышение уровня стандартизации, что позволит дольше поддерживать развернутые конечные точки. В более широком смысле это не менее, а может быть, и более важно, чем обновление отдельных поколений ядра.
Основное внимание на Arm Tech Day 2021 компания Arm уделила своим новым платформам V1 и N2. ИС Neoverse V1, как мы слышали, появилась на 3-4 квартала раньше, чем N2, но это менее эффективное, но более производительное решение на ядро, ориентированное непосредственно на вычисления в стиле x86. Neoverse N2 призван стать облачным ядром будущего.
Как правило, Arm ориентируется на производительность AWS Graviton2. Это несколько странное сравнение, поскольку AWS создает Graviton2 и устанавливает цены на него для строго фиксированных клиентов. В то время как существует стоимость перехода с x86 на Arm, для таких приложений, как Nginx, существует большая стоимость перехода с AWS на Azure. Это сродни тому, как если бы Intel создала облако серверов Xeon, в котором нельзя было бы купить непосредственно используемые чипы/системы, а затем показала бы производительность Intel Xeon в сравнении с производительностью и стоимостью AMD EPYC в своем собственном облаке. Это несколько безумное предложение, но оно аналогично тому, что делает использование AWS Graviton2 для ценообразования на экземпляры AWS x86. В этом нет ничего плохого, но нужно хорошо понимать контекст.
Аналогичным образом Arm обсуждает свою производительность в разрезе потоков. Поскольку Arm не использует SMT/ Hyper-Threading, у нее есть только полноценные ядра. В результате по всем потокам при одинаковом числе потоков она может оказаться впереди. Если мы сравниваем то, что можно получить в коммерческом доступе сегодня, то это Arm Neoverse N1 64C/ 64T (обычно Graviton2) против «Traditional 2021 40c, 80t», который является прогнозом для Intel Xeon Platinum 8380, и «Traditional 2021 64c, 128t», который, вероятно, является EPYC 7763 или другой частью EPYC 7003. Таким образом, на этом графике Arm показывает, что, по ее мнению, процессоры следующего поколения, созданные партнерами на базе ее IP, будут превосходить современные процессоры x86 в расчете на один поток и на один сокет. Опять же, для понимания этих данных необходим контекст.
В частности, две линейки Neoverse V1 и N2 компании Arm предназначены для несколько разных рынков: V1 ориентирована на более высокую производительность в расчете на один поток, а N2 — на масштабирование.
Как мы обычно видим, Arm считает, что следующее поколение V1 будет быстрее предыдущего поколения N1 по IPC примерно на 48%.
Можно заметить, что показатели N2 Arm оказались лучше, чем ожидалось, поэтому прирост IPC по сравнению с N1 составил около 32%. Если посмотреть на эти два графика, то можно сразу же подумать, что V1 всего лишь на 12% быстрее N2, но не предназначен для такого же масштабирования и эффективности. Ответ заключается в том, что V1 — это более старый IP-архитектор, и он в значительной степени ориентирован на производительность SVE для рабочих нагрузок в стиле HPC. Это важно, поскольку и Intel, и AMD эффективно поддерживают этот стиль вычислений в своих линейках.
Возвращаясь к теме, компания Arm вновь считает, что будущие партнерские решения, построенные на базе V1 и N2, будут быстрее современных x86-вычислений от Intel и AMD.
Основное различие, которое следует уяснить нашим читателям, заключается в том, что Neoverse V1 — это скорее вычислительное ядро для высокопроизводительных вычислений, а N2 — масштабируемое облачное ядро. Если вы работаете с веб-сервером, то вам больше подойдет N2, чем V1.
Подведя итоги, перейдем к деталям. Сначала мы рассмотрим V1. Затем мы рассмотрим N2. И наконец, мы сосредоточимся на когерентной ячеистой сети, которую Arm предлагает своей экосистеме. Если вас не интересуют детали процессоров, то часть, посвященная сетчатым сетям, возможно, находится на уровень выше и имеет большее значение для проектирования систем.