Aнoнс прoцeссoрa Cerebras ― Cerebras Wafer Scale Engine (WSE) может ли быть движкa Cerebras мaсштaбa крeмниeвoй плaстины ― сoстoялся в рaмкax eжeгoднoй кoнфeрeнции Hot Chips 31. Глядючи нa этoгo крeмниeвoгo мoнстрa удивляeт дaжe нe тo, чтo eгo смoгли издать вo плоти. Удивляет смелость замысла и творение разработчиков, рискнувших разработать кристаллит площадью 46 225 квадратных миллиметров со сторонами 21,5 см. Получи изготовление одного процессора уходит целая 300-мм наручи. При малейшей ошибке эшелон брака составляет 100 %, а цену вопроса хоть трудно представить.
Выпуском Cerebras WSE занимается шатия-братия TSMC. Техпроцесс ― 16 нм FinFET. Таковой тайваньский производитель тоже заслужил свидетельство за выпуск Cerebras. Бизнес подобного чипа потребовало высшего мастерства и решения народ проблем, но оно того стоило, уверяют разработчики. Фишка Cerebras ― это фактически суперЭВМ на чипе с невероятной пропускной способностью, минимальным потреблением и фантастическим параллелизмом. В естественный момент это идеальное вотум для машинного обучения, которое позволит исследователям встать на путь решать задачи чрезвычайной сложности.
Каждый вискер Cerebras WSE содержит 1,2 трлн транзисторов, организованных в 400 000 ИИ-оптимизированных вычислительных ядер и 18 Гбайт локальной распределённой памяти SRAM. По сей день это связано ячеистой сетью с общей производительностью 100 петабит в постой. Пропускная способность памяти достигает 9 Пбайт/с. Степень памяти одноуровневая. Кеш-памяти блистает своим отсутствием, перекрытия нет, задержки обращения минимальные. Сие идеальная архитектура для ускорения задач, связанных с ИИ. Голые цифры: в сравнении с самыми современными графическими ядрами ставка Cerebras обеспечивает в 3000 как-то раз больший объём памяти бери кристалле и в 10 000 большую обороты обмена с памятью.
Вычислительные ядра Cerebras ― SLAC (Sparse Linear Algebra Cores) ― сполна программируемые и могут быть оптимизированы угоду кому) работы с любыми нейронными сетями. Больше того, архитектура ядер изначально фильтрует талант, представленные нулями. Это освобождает вычислительные резервы от необходимости проводить холостые операции умножения получи ноль, что для нагрузки разрежёнными данными означает спурт расчётов и предельную энергоэффективность. Тем самым сердце компьютера Cerebras оказывается в сотни другими словами даже тысячи раз эффективнее в (видах машинного обучения в терминах задействованной площади кристалла и его потребления, нежели актуальные решения для ИИ и машинного обучения.
Устройство чипа подобного размера потребовало массу уникальных решений. Его даже если упаковывать в корпус пришлось только-только ли не вручную. Возникли проблемы с подводом питания к кристаллу и его охлаждением. Отделение тепла стал возможен один жидкостью и лишь с организацией зональной подачи с вертикальной циркуляцией. Тем невыгодный менее, все проблемы были решены и чепок вышел рабочим. Будет завлекательно узнать о его практическом применении.
Источники: