Нa кoнфeрeнции Hot Chips 31 кoмпaния Intel рaскрылa колонна вaжнeйшиx xaрaктeристик сeмeйствa ускoритeлeй нeйрoнныx сeтeй Nervana NNP-T для того мaшиннoгo oбучeния (трeнирoвки). Ускoритeли Nervana NNP-T, чтo вaжнo знaть пользу кого дaльнeйшeгo пoнимaния, Intel рaзрaбaтывaeт вмeстe с китaйским интeрнeт-гигaнтoм кoмпaниeй Baidu. Вeрoятнo имeннo настоящий факт определил выбор производства чипов Nervana NNP-T. Как бы оказалось, производством и упаковкой сих решений Intel занимается тайваньская гопкомпания TSMC. В случае санкций, направленных напротив сотрудничества американских и китайских компаний, TSMC может разыскаться той тихой гаванью, идеже без помех смогут ладно трудиться все заинтересованные стороны.
Ускорители Nervana NNP-T базируются сверху оригинальной разработке израильской компании Nervana, поглощённой Intel в 2016 году. Кодовое номенклатура ускорителя Spring Crest. Приговор предназначено для масштабируемых и распределённых платформ глубокого машинного обучения подобно ((тому) как) для облачных сервисов, приблизительно и для запуска на пограничном (периферийном) оборудовании. Анонсированный чипок относится к старшему сегменту и ориентирован держи масштабируемые платформы в составе центров соответственно обработке данных. Традиционно в целях этого сектора компания Intel предлагала универсальные платформы Xeon (Scalable) с поддержкой специальных ИИ-инструкций. Все же компания признаёт, что специализированные ускорители пользу кого ML и ИИ ― это самое правильное иджма с точки зрения удержания в приемлемых рамках энергетического и производительного бюджетов. Гвозди микроскопом есть забивать, но выходит неспособно и дорого.
Итак, ускорители Nervana NNP-T выпускает честная) TSMC, для чего использует 16-нм техпроцесс CLN16FF+ и транзисторы FinFET. Упаковкой ускорителей как и занимается она, с применением компоновки 2.5D CoWoS (Chip-on-Wafer-on-Substrate). Опорный кристалл Nervana NNP-T с вычислительными ядрами, памятью и интерфейсами площадью 688 мм2 располагается в кремниевом мосту-подложке площадью 1200 мм2. Хрусталь окружают расположенные на мосту 4 микросхемы HBM2-2400 ёмкостью 8 Гбайт каждая. Проститутка ёмкость памяти Nervana NNP-T достигает 32 Гбайт со скоростью 2,4 Гбайт/с сверху каждый вывод (1,2 Тбайт/с для весь массив памяти).
Сердце компьютера Nervana NNP-T содержит до 24 тензорных ядер с суммарной производительностью 119 триллиона операций в помедли (TOPS). К центральному процессору проблемы) подключается 16-ю линиями шины PCI Express 4.0. Для того связи с соседними ускорителями используется интерфейс SerDes с 8 приёмопередатчиков по 8 линий отдельный. Всего 64 линии SerDes обеспечат выбор масштаба до 1024 узлов в области 8 ускорителей в каждом. Тактовая колебание каждого тензорного ядра Nervana NNP-T может добиваться 1,1 ГГц. Это даёт максимальное сила потребления на уровне 250 Вт, даром что при необходимости потребление может оказываться удержано на уровне 150 Вт. Транзисторный смета старшего кристалла, кстати, 27 млрд стукко ключей. Графический процессор NVIDIA GV100 с его 21,1 млрд транзисторов отодвинут в сторонку.
Тензорные ядра в составе Nervana NNP-T объединены ячеистой сетью с малыми задержками. В одном ряду с ядрами в сеть вплетена встроенная и распределённая сообразно кристаллу память SRAM общим объёмом 60 Мбайт (сообразно 2,5 Мбайт на каждое тензорное микрочастица). Такая организация позволит уменьшать пересылку данных во обманчивый пул памяти, хотя получай подхвате у Nervana NNP-T на одной с ней подложке находится опять 32 Гбайт памяти HBM2.
Добавим, мало-: неграмотный углубляясь в типы поддерживаемых ускорителем моделей обучения, ась? Nervana NNP-T может ускорять оптимальным образом во вкусе многие существующие модели, эдак ещё и не придуманные, потому как тензорные ядра могут бытийствовать перепрограммированными удобным для владельцев образом. Поставки решения в виде PCIe-адаптеров и модулей в формфакторе OAM (Open Compute) начнутся в 2020 году.
Матрица: