Вот один из самых «чиповых» анонсов, которые мы видели за последнее время. Компания Broadcom представила новый чип коммутатора под названием Broadcom Jerico3-AI. Это «-AI» может навести на мысль, что в чипе реализованы вычислительные функции, как в NVIDIA Infiniband, но это не так. Broadcom также утверждает, что в новой линейке Jericho3-AI NVIDIA Infiniband плохо подходит для кластеров искусственного интеллекта.
Выпущен Ethernet-коммутатор Broadcom Jericho3-AI
Для тех, кто не знаком, Broadcom имеет три основных семейства high-end коммутаторов. Линейка Tomahawk — это платформа коммутаторов с высокой пропускной способностью. Trident — платформа, которую мы часто видим с более широкими возможностями. Далее, с меньшей пропускной способностью, но с более глубокими буферами и большей программируемостью идет линейка Jericho. Broadcom Jericho3-AI BCM88890 — новейший представитель этой третьей линейки с пропускной способностью 28,8 ТГц. Этот чип имеет 144 полосы SerDes, работающих на скорости 106 Гбит/с PAM4. Он поддерживает до 18 портов 800 Гбит/с, 36 портов 400 Гбит/с или 72 порта 200 Гбит/с.
Презентация Broadcom, посвященная новому чипу-коммутатору, излагает простую мысль. Крупные компании и даже NVIDIA считают, что рабочие нагрузки ИИ могут быть ограничены сетевыми задержками и пропускной способностью.
Ткань Jericho3-AI предназначена для снижения времени, затрачиваемого на работу в сети при обучении ИИ.
Ключевыми особенностями ткани Jericho3-AI являются балансировка нагрузки для поддержания каналов в незагруженном состоянии, планирование работы ткани, обход отказа без последствий, а также высокий Ethernet Radix. Примечательно, что, хотя мы видим коммутаторы NVIDIA NDR Infiniband 400 Гбит/с с такими функциями, как внутрисетевые вычисления SHARP, мы спросили Broadcom, есть ли у них подобная функция, и они не ответили, что есть.
Тем не менее, Broadcom утверждает, что ее Jericho3-AI Ethernet превосходит Infiniband от NVIDIA примерно на 10% по производительности NCCL. Обратите внимание, что на графике, который демонстрирует Broadcom, не используется шкала 0.
Кроме того, Broadcom утверждает, что, поскольку она способна работать со скоростью порта 800 Гбит/с (для серверов PCIe Gen6) и выше, она является лучшим выбором. В связи с тем, что в названии присутствует слово «AI», интересно, что Broadcom не включает в список функций вычислений сетевой AI, поскольку это является основным преимуществом NVIDIA с ее архитектурой Infiniband.
Broadcom также демонстрирует совместно упакованную оптику, а также ЦАПы, которые, как мы предполагаем, не работают вместе. Однако компания утверждает, что ее решение является более энергоэффективным.
Это был странный анонс, поскольку в нем было очень мало информации о скоростях и питании. Линейка Jericho не является высокопропускной линейкой Broadcom, идущей за Tomahawk и Trident, так что, скорее всего, причина именно в этом.
Последние слова
Мы должны узнать больше о Jericho3-AI на региональном саммите OCP 2023 на этой неделе. Мы также ожидаем, что пройдет некоторое время, прежде чем мы увидим продукты с новыми чипами. Обычно анонсируются микросхемы коммутаторов, затем идет разработка коммутаторов, затем кремний поступает к OEM-производителям, после чего коммутаторы появляются в продаже. Тем временем, у нас в лаборатории есть платформа Tomahawk 4, которую мы покажем с сетевыми картами NVIDIA ConnectX-7, когда видео будет готово к монтажу.
Патрик Дж. Кеннеди в Twitter: «Просто для масштаба. Процессор 4-го поколения @Intel Xeon Scalable «Sapphire Rapids» рядом с процессором @Broadcom Tomahawk 4. Вы должны увидеть разницу в размерах кулеров.