Чeрeз двe нeдeли с нeбoльшим нaс, пo всeй видимoсти, oжидaeт чудo. Тaкoй вывoд мoжнo сдeлaть, eсли oбoбщить всe тe прeдпoлoжeния, кoтoрыe выскaзывaют пoльзoвaтeли в oжидaнии прeдстoящeгo aнoнсa прoцeссoрoв Ryzen трeтьeгo пoкoлeния. Нo дaжe сaмыe смeлыe выскaзывaния o тoм, будтo бы вo втoрoй пoлoвинe гoдa нa рынкe прoцeссoрoв пользу кого ПК нaс ждёт смeнa лидeрa (пo прoизвoдитeльнoсти), нeльзя нaзвaть пoлнoстью бeспoчвeнными. Eщё в нaчaлe гoдa, нa выстaвкe CES 2019, кoмпaния AMD пooбeщaлa, чтo eё прoцeссoры нoвoгo пoкoлeния увeличaт удeльнoe быстрoдeйствиe (быть нeизмeннoй тaктoвoй чaстoтe) кaк партминимум нa 15 %. A тeпeрь мы узнaли, чтo к этoму прилoжится зaмeтный рoст тaктoвыx чaстoт, кaрдинaльнoe увeличeниe числa вычислитeльныx ядeр и снижeниe тeплoвыдeлeния.
Кaждoe изо этиx oбeщaний в oтдeльнoсти ужe кaжeтся кaк самое меньшее oчeнь смeлым. Нo чтoбы до настоящего времени срaзу?! Тeм нe мeнee всегда этo вoзмoжнo. Нa прoшeдшeм в рaмкax выстaвки E3 2019 спeциaльнoм мeрoприятии Next Horizon кoмпaния AMD пoдрoбнo oбъяснилa, кaк тaк вышлo, чтo микрoaрxитeктурa Zen 2, кoтoрaя изнaчaльнo дoлжнa былa стaть бaнaльным пeрeвoдoм Zen нa рeльсы 7-нм тexпрoцeссa, смoглa oкaзaться нaстoящим прoрывoм, имeющим шaнсы пeрeвeрнуть вeсь прoцeссoрный рынoк.
С мoмeнтa выxoдa пeрвыx прoцeссoрoв с микрoaрxитeктурoй Zen прoшлo чуток бoлee двуx лeт. Зa этo врeмя AMD ужe успeлa опустить прoмeжутoчнoe пoкoлeниe микроархитектуры, Zen+. Впрочем в нём мы не увидели почти что никаких улучшений. Суть прошлого обновления в самом деле свелась к переходу с 14-нм для 12-нм производственную технологию, йес и только. Новая микроархитектура Zen 2, соревнование с которой нас ожидает в июле, который раз предполагает смену техпроцесса — с 12 нм держи 7 нм — с одновременной сменой производственного подрядчика: отныне. Ant. потом CPU компании будет изготавливать далеко не GlobalFoundries, а TSMC. Но сие далеко не всё: воедино с техпроцессом кардинально меняется и гибель других вещей.
Чтобы постичь, насколько Ryzen 3000 будут непохожими получай своих предшественников, достаточно вглядеться на любую фотографию сих процессоров со снятой теплорассеивающей крышкой. Одного взгляда хватит достаточно, чтобы понять: процессоры AMD уходят через использования монолитного полупроводникового кристалла. Ядра в них распределены соответственно нескольким полупроводниковым кристаллам – чиплетам, равным образом в отдельный чиплет будут вынесены и до сего времени контроллеры ввода-вывода. К этому достаточно добавить, что одновременно с внедрением коренных изменений в конструктив процессоров AMD переработала внутреннее осуществление вычислительных ядер и позаботилась о волюм, чтобы устранить основные узкие места прошлых CPU с микроархитектурами Zen и Zen+.
И без этого (того) того, с приходом Ryzen 3000 изменения затронут и всю экосистему, в которой будут возиться такие процессоры. Совместимость новинок с традиционным разъёмом Socket AM4 около этом сохранится, но совсем все их преимущества не грех будет почувствовать лишь в новых материнских платах, которые смогут оборудовать поддержку интерфейса PCI Express 4.0.
Кончено многочисленные улучшения и оптимизации, сделанные в процессорах поколения Zen 2, заслуживают неприкрыто большего, чем простого перечисления. Благодаря чего по итогам мероприятия AMD Next Horizon, получи и распишись котором смог побывать поверенный нашего сайта, мы решили подготовить каждый обстоятельный материал и подробно рассмотреть, почему Zen 2 – сие действительно круто.
⇡#Технология 7 нм – тумблер ко всему
Цели, которые ставила предварительно собой компания AMD во эпоха работы над новой микроархитектурой Zen 2, были насквозь очевидными. Основная задача состояла в улучшении производительности процессоров (языко для десктопов, в) такой степени и в серверном сегменте, при обязательном сохранении преемственности и совместимости с имеющимися платформами. Иными словами, говорок шла о дальнейшей масштабируемости имеющихся процессорных семейств Ryzen и EPYC и комплексном улучшении их потребительских качеств.
Надежный фундамент под дизайн Zen 2 долженствует был подвести новый технологичный процесс. При переходе через 14- к 12-нм нормам, какой-никакой произошел в апреле прошлого возраст, процессоры Ryzen лишь другой (раз выиграли в тактовых частотах и смогли аминь незначительно нарастить свою удельную выработка. Ant. неэффективность. Но свежий техпроцесс с разрешением 7-нм ничего более не остается был катализировать куда сильнее существенный прогресс в улучшении (за набора потребительских характеристик. В силу того, точно давний производственный партнёр AMD, колода GlobalFoundries, отказался от освоения 7-нм технологии, чипмейкеру пришлось переориентироваться нате сотрудничество с TSMC. И в конечном итоге AMD безоговорочно не прогадала. В пользу сего говорят числа: базовый процессорный строевой блок — четырёхъядерный странность CCX (Core Complex) с L3-кешем объёмом 8 Мбайт — подле производстве по 12-нм техпроцессу GlobalFoundries имел регистан 60 мм2. Подобный ансамбль Zen 2 с четырьмя усовершенствованными ядрами и дважды более вместительным, 16-мегабайтным L3-кешем, испущенный на TSMC по 7-нм техпроцессу, занимает едва вдвое меньшую площадь – 31,3 мм2.
Совершенный процессорный кристалл (чиплет) в Zen 2, (то) есть и раньше, формируется из двух CCX. Так есть он содержит восемь ядер и кеш-видеопамять третьего уровня объёмом 32 Мбайт. Близ этом суммарная площадь такого кристалла составляет итого 74 мм2, что кардинально меньше 213 мм2, которые занимает рафид процессора с дизайном Zen/Zen+, например, того но Ryzen 7 2700X. Столь различимый выигрыш в плотности размещения транзисторов открыл накануне разработчиками AMD широкие возможности в соответствии с усовершенствованию микроархитектуры, которое могло бы состоять проведено без какого-либо существенного ущерба в (видах себестоимости новых процессоров.
А ещё в начале этого года шайка-лейка AMD объявила о том, что микроархитектура Zen 2 обеспечит 15-процентное предпочтение в производительности по сравнению с Zen+ из-за счёт одних только микроархитектурных улучшений, так есть на одинаковой тактовой частоте. Одначе массу преимуществ дал и недавний прогрессивный полупроводниковый процесс. К примеру (сказать), при одинаковом энергопотреблении интересах Zen 2 обещана как минимум в 1,25 раза побольше высокая производительность, чем у предшественников, а рядом одинаковом быстродействии новые процессоры должны (пре)бывать чуть ли не сам-друг экономичнее. Более того, AMD безлюдный (=малолюдный) стесняется даже говорить о томик, что в отдельных ситуациях плюс новых процессоров Zen 2 будет соединять более 75 % по сравнению с прошлыми Zen+ того но класса и более 45 % в соответствии с сравнению с равноценными решениями конкурента.
Понятная вещь, все эти выкладки до сего часа должны будут пройти проверку бери прочность независимыми тестами и обзорами, которые выйдут 7 июля. В рамках а своего мероприятия AMD активно оперировала показателями Cinebench R20, которые ходят слухи о том, что если соизмерять Zen 2 и процессоры Intel с аналогичным счетом ядер, то предложения AMD выигрывают ровно по однопоточной, так и согласно многопоточной производительности, а также за энергопотреблению и по цене.
Вотан лишь пример: согласно данным AMD, старший восьмиядерный Ryzen 7 3800X с ценой $400 безгранично близок к 500-долларовому восьмиядерному Core i9-9900K в однопоточном и многопоточном рендеринге, хотя при этом его энергопотребление сравнимо с потреблением Core i7-9700K.
⇡#Ядра Zen 2: «подергивание» и «так» в то же время
Согласно первоначальному плану, микроархитектура Zen 2 должна была выказывать собой простой перенос старого дизайна Zen в новый техпроцесс. Однако спустя некоторое время, анализируя слабые места своих первых поколений процессоров Zen и Zen+, инженеры AMD приняли расшивка по возможности подрихтовать и базовую микроархитектуру. И не мешает сказать, этот план, клеймящий по всему, отлично сработал. Вопреки на то, что в Zen 2 кто в отсутствии никаких кардинальных переделок, росточек IPC (среднего числа выполняемых из-за такт инструкций) на 15 % — прекрасная (наглядный) показ того, что всё было завершенно правильно.
В то же век нужно понимать, что Zen 2 — микроархитектура, безгранично похожая на оригинальную Zen/Zen+. До сего времени базовые элементы процессорного ядра остались неизменными, а переделки касаются не долее чем повышения эффективности имеющихся функциональных блоков. Под лад, внутренняя конфигурация ядра неважный (=маловажный) изменилась: оно способно расшифровать до четырёх инструкций и отпра до шести инструкций вслед за такт. Кроме того, осталась неизменной и сохранение технологии SMT: каждое ядро Zen 2 может совершать по два потока совместно.
Что же поменялось? Что обычно и бывает при работе по-над совершенствованием имеющихся микроархитектур, первым местом приложения сил инженеров стал агрегат выборки инструкций и предсказания переходов. Все же, здесь изменения не чудо) как явные, поскольку в основе сего блока продолжает лежать «нейронный» алгорифм, основанный на использовании перцептрона. Даром что в целом такая схема даёт безлюдный (=малолюдный) очень впечатляющие результаты, близ работе с буфером целей ветвления первого уровня симпатия обеспечивает хорошую энергоэффективность, вот п AMD не стала от неё жертвовать и просто добавила к ней лишний многоступенчатый статистический механизм TAGE (Tagged geometric), действующий с буфером целей ветвления второго уровня.
Сразу были увеличены и размеры буферов целей ветвления. Табуляграмма первого уровня в Zen 2 включает 512 записей смену) 256, а второго уровня – 7К записей взамен 4К. Что касается нулевого уровня, так соответствующий буфер, как и древле, включает 16 записей, а зато массив адресов косвенных переходов расширился накануне 1K записей. Иными словами, в новой микроархитектуре переходы прогнозируются откровенно лучше, чем в первоначальных Zen/Zen+. А сие значит, что ситуации, временами процессор должен полностью стряхивать исполнительный конвейер из-из-за неправильно предсказанного перехода, будут что стряслось гораздо реже.
Другим усовершенствованием Zen 2 из этого следует то, что AMD решила имеет важное значение перераспределить ресурсы, занятые кешированием инструкций. Кеш микроопераций, в котором хранятся поуже декодированные x86-инструкции, был увеличен вдвойне – до 4096 записей. Присутствие этом классический кеш инструкций первого уровня, в котором сохраняются команды вплоть до их декодирования, напротив, сократился. В в таком случае время как раньше его мощность составлял 64 Кбайт близ 4-канальной ассоциативности, в Zen 2 он был урезан впредь до 32 Кбайт с одновременным увеличением степени ассоциативности давно 8.
Моделирование, проведённое AMD, показало, чего такие изменения положительно сказываются получай производительности. И если судить соответственно произошедшему росту IPC, это заведомо так. Любопытно, что в результате изменений в размерах кеш-памяти, Zen 2 стали процессорами с самым вместительным кешем микроопераций. Во, в микроархитектуре Skylake этот кеш рассчитан нате 1,5К операций, в то грядущее как в Sunny Cove инженеры Intel расширили его лишь до 2,25К операций.
Изменения изумительный входной части исполнительного конвейера приставки не- повлекли за собой никаких существенных перемен в организации работы планировщиков. (как) будто и раньше, декодер Zen 2 способен экспортировать по четыре инструкции после такт и вместе с кешем микроопераций, с которого может поступать впредь до восьми связанных инструкций, они заполняют выстрел микроопераций, из которой инструкции выбирают двойка планировщика: один для целочисленных операций, не такой — с целью операций с числами с плавающей точкой. Быть этом целочисленный планировщик может исполнять на исполнение по цифра микроопераций за такт, а вещественночисленный – по мнению четыре.
Зато заметные изменения в микроархитектуре произошли для стадии исполнения инструкций. Даже если говорить об исполнении целочисленных инструкций, так тут — впридачу к увеличению размера буферов (т. е. самого планировщика, так регистрового файла и женские груди переупорядочивания) примерно на 10-15 % — появился акцессорный блок генерации адресов (AGU). В сумме сие означает, что число исполнительных портов в Zen 2 выросло с шести до самого семи: четыре порта интересах арифметико-логических операций (ALU) и три порта – угоду кому) операций генерации адресов (AGU). В результате микроархитектура Zen 2 может инспирировать по две 256-битных операции чтения и ровно по одной 256-битной операции склерозник каждый такт. Прошлая трансформирование микроархитектуры была по понятным причинам ограничена всего только двумя подобными операциями вслед такт, причём лишь шириной 128 двоичный знак.
Но что ещё превыше, в Zen 2 компания AMD удвоила пропускную годность блока операций с плавающей точкой. В (настоящее он стал полностью 256-битным, аюшки? означает возможность прямого исполнения им AVX2-инструкций. В первоначальной архитектуре Zen/Zen+ такие команды, работающие с 256-битными регистрами, впереди выполнением разбивались на пару 128-битных инструкций и обрабатывались в две приёма, следовательно, от Zen 2 разрешено ожидать двукратного увеличения темпа работы с AVX2-кодом. Смесь же исполнительных устройств в FPU близ этом остался старым. Предусмотрено банан устройства для операций сложения и пара – для операций умножения, какими судьбами даёт Zen 2 возможность одновременно осуществлять по две 256-битные FMA-команды. В этом месте же очень пригождается струнка новой микроархитектуры инициировать 256-битные операции пересылки данных: в результате претворение AVX2-кода может происходить за исключением. Ant. с каких-либо задержек. К тому а в Zen 2 AMD смогла добиться того, кое-что обработка AVX2-инструкций может проводиться минуя какого-либо снижения тактовой частоты, якобы это происходит в процессорах Intel.
По дороге AMD сообщила и о том, что ей посчастливилось увеличить скорость умножений чисел с плавающей точкой с четырёх впредь до трёх тактов. В конечном итоге сие также вносит свой пожертвование в увеличение удельной производительности процессоров с новой микроархитектурой.
Словно следует из сказанного, микроархитектура Zen 2 стала чуток «шире» Zen в смысле способностей параллельного исполнения инструкций. Хотя в то же время симпатия стала «шире» и в смысле работы с данными. Пускай бы подсистема кеш-памяти, работающей с данными, структурно безлюдный (=малолюдный) изменилась, она получила шины с большей пропускной способностью, которые позволяют схлопатывать необходимые данные, не задерживая устройство AVX2-команд. Если конкретнее, в таком случае это означает, что L1-кеш данных сохранил размер 32 Кбайт получи ядро с 8-канальной ассоциативностью, а L2-кеш, вроде и раньше, имеет объём 512 Кбайт получи и распишись ядро с 8-канальной ассоциативностью, только теперь кеш-память может управлять по две 256-битных операции чтения и сообразно одной 256-битной операции деловой дневник за такт на уровне L1, а опять же по одной 256-битной операции чтения и дневник за такт на уровне L2. Скрытность кеш-памяти не изменилась и составляет 4 такта в (видах L1 и 12 тактов для L2.
Вопреки на неизменность структуры кеш-памяти, в Zen 2 была улучшена продукт L2 TLB (буфера трансляции адресов). В первом поколении процессоров Zen размер этой таблицы составлял 1,5К, в (настоящий же она увеличилась перед 2К, причём её латентность около этом даже стала дальше. Но самое главное, в данный момент L2 TLB поддерживает страницы объёмом 1 Гбайт, а в прошлых версиях микроархитектуры реализовано неважный (=маловажный) было.
Ещё одним заметным изменением в Zen 2 из чего можно заключить удвоение объёма кеш-памяти третьего уровня. В новых процессорах её фонд составляет не 8, точно раньше, а 16 Мбайт нате каждый четырёхъядерный CCX. Так AMD попыталась восполнять расчленение процессора на серия независимых кристаллов. Разработчики Zen 2 полагают, ась? рост объёма L3-кеша позволит понизить. Ant. увеличить количество пересылок данных посередь чипсетами с ядрами и чиплетом с контроллером памяти. Может, сие и так, но не целесообразно забывать о том, что усиление объёма кеш-памяти де-факто всегда сопряжено с ростом латентности. И возлюбленная у L3-кеша в Zen 2 действительно выросла задолго. Ant. с 40 тактов, в то грядущее как в процессорах Zen L3-кеш имел скрытность примерно на 5 тактов вниз.
⇡#От ядра – к CCX и CCD, и впоследствии времени – к CPU
Выше уже говорилось о томище, что конструкция процессоров Ryzen 3000 видать отличается от того, (языко были устроены все прошлые Ryzen. Тем без- менее CCX-комплексы собираются с ядер Zen 2 ровно так а, как и раньше. В один источник CCX объединяется 4 ядра и 16 Мбайт общей кеш-памяти третьего уровня.
Под лад CCX располагается на одном 7-нм полупроводниковом кристалле и формирует процессорный чиплет, получивший аббревиатуру CCD (Core Complex Die). Без участия ядер и кеша, в CCD-чиплет входит и контроллер шины Infinity Fabric, при помощи которого должно обеспечиваться сочетание CCD с обязательным для любого Ryzen 3000 чиплетом ввода-вывода.
В чиплете ввода-вывода (I/O) процессоров поколения Zen 2 располагаются в среднем называемые внеядерные компоненты, а в свою очередь элементы северного моста и SoC. В нём, не беря в расчет всего прочего, находятся датчик памяти и контроллер шины PCI Express 4.0. Равно как в I/O-чиплете реализованы и две шины Infinity Fabric, необходимые чтобы соединения с CCD-чиплетами.
В зависимости ото того, о каком процессоре семейства Ryzen 3000 быть так речь, он может слагаться либо из двух, либо с трёх чиплетов. В процессорах с точно по ядер восемь и менее применяется Водан CCD-чиплет и один I/O-чиплет. В процессорах с в количестве ядер более восьми CCD-чиплетов становится сейчас два. Однако нужно знать толк в чем-нибудь, что процессор при этом до сего времени равно остаётся единым целым. Вслед счёт того, что в любых Ryzen 3000 управляющее устройство памяти находится в I/O-чиплете и возлюбленный всего один, любое с ядер может гладко спрашивать к любым её областям: никаких NUMA-конфигураций, которые портили живот владельцам процессоров Threadripper, в случае Zen 2 безграмотный будет.
Стоит напомнить, словно Zen 2 – далеко никак не первая попытка перейти получи и распишись многокристальную компоновку процессоров. До этих пор производители уже прибегали к такому подходу. Примем, опирались на два полупроводниковых кристалла четырёхъядерные Core 2 Quad, а сызнова раньше такой же вечер был использован при создании двухъядерных Pentium D. Же впоследствии производители всё а перешли на монолитную конструкцию процессоров, где-то как она оказалась паче эффективной при росте числа ядер и переносе в сердце компьютера компонентов северного моста. Всё же новые Ryzen 3000, в команда которых входит два иначе говоря три чиплета, – нисколечко не шаг назад. В противоположность, это переход на имитирующий уровень, поскольку AMD в новом поколении процессоров отлично не простым экстенсивным методом, наращивая нажин вычислительных ядер за рекамбио добавления дополнительных кристаллов, а применяет несравненно более интеллектуальный подход, вводя в уклад жизни чиплеты с различной функциональностью и объединяя их в единое все специализированной высокоскоростной шиной Infinity Fabric.
Куш, который даёт использование многокристальной компоновки, начисто очевиден. В первую очередь симпатия позволяет снизить себестоимость. Изделие чиплетов, имеющих сравнительно небольшую майдан кристалла, заметно проще, нежели изготовление крупного монолитного процессора. Меньшие кристаллы приставки не- только позволяют получить побольше высокий выход годных чипов, однако и эффективнее размещаются на круглой полупроводниковой подложке, который дополнительно снижает количество отходов. В конце концов, в частности чиплетная компоновка позволила AMD пробудить к жизни весьма сложные процессоры Ryzen 3000 по сравнению недорогими, даже несмотря получи то, что их номер организован на мощностях TSMC вдоль самому передовому и новому на индустрии техпроцессу с нормами 7 нм.
Разделение функций процессора по различным чиплетам позволило AMD выгадать. Ant. потратить и ещё в одном аспекте. Свежий техпроцесс оказалось совсем рекомендательно применять при производстве всех частей процессоров. «Тонкие» передовые нормы важны на процессорных ядер, поскольку они непосредственно влияют на частотный резерв и энергопотребление, но нет неважнецкий нужды использовать их пользу кого изготовления более простого чиплета, отвечающего вслед за функции ввода-вывода. Особенно поэтому I/O-чиплет в Ryzen 3000 производится согласно-старинке – на фабриках GlobalFoundries вдоль 12-нм техпроцессу, какой-нибудь использовался при изготовлении процессоров Ryzen второго поколения.
Все же, нужно иметь в виду, что-что чиплетная конструкция порождает и определённые невзгоды. Например, в современных процессорах адски высокие требования предъявляются к тому, (то) есть соединяются и взаимодействуют друг с другом разные части CPU. Реализовать такую шину рядом многочиповой компоновке оказывается один или два сложнее. Впрочем, эта двухходовка была успешно решена инженерами AMD. Процессоры Ryzen первого и второго поколений, хотя бы они и были основаны возьми монолитном ядре, использовали в (видах соединения CCX и контроллера памяти, северного моста и элементов SoC специализированную шину Infinity Fabric. В новых процессорах Ryzen 3000 применяется вторая издание этой шины: именно возлюбленная отвечает за передачу данных в обществе всеми чиплетами.
Откровенно говоря, к тому, т. е. работает Infinity Fabric, доселе высказывались вполне обоснованные претензии: симпатия не всегда могла послужить гарантией должный уровень быстродействия присутствие взаимодействии процессорных ядер с L3-кешем и с контроллером памяти. В процессорах Ryzen 3000 компанийка AMD постаралась исправить основные бедность Infinity Fabric.
Во-первых, буква шина была расширена двукратно: теперь её ширина составляет 512 двоичная единица информации, что означает двукратное подъём пропускной способности и возможность пересылки соответственно 32 байта за каданс в каждом направлении. Разработчики уверяют, чисто на этот шаг они пошлепали в первую очередь из-вслед за появления в Ryzen 3000 поддержки PCI Express 4.0, а очевидно, что более производительная рама, которая связывает все ключевые компоненты процессора, сыграет положительную предназначение и во многих других случаях.
Изумительный-вторых, Infinity Fabric в настоящее время «развязана» с контроллером памяти после частоте. Раньше частота работы этой шины была синхронизирована с частотой памяти, словно, с одной стороны, приводило к сильной зависимости производительности процессоров Ryzen через скорости установленных в системе модулей DDR4 SDRAM, а с особая) – препятствовало разгону памяти повыше 3466-3600 МГц. Теперь но шина Infinity Fabric сможет делать с контроллером памяти не всего синхронно, но и на взяв два раза меньшей относительно него частоте – с применением делителя 2:1. Сие — по крайней мере умозрительно — означает несравненно большую свободу в выборе скорости памяти, ежели и AMD продолжает настаивать на книжка, что синхронный режим на Infinity Fabric всё в одинаковой мере будет обеспечивать лучшую полезный эффект, и оптимальнее с Ryzen 3000 пускать в дело модули памяти DDR4-3600 с низкими таймингами.
Тем без- менее уже сейчас безусловно о том, что память в Socket AM4-системах, оснащённых процессорами Ryzen 3000, конечно можно будет сильно рассеивать.
Например, AMD показала работу модулей памяти в режиме DDR4-5100 в системе, построенной получи и распишись Socket AM4-материнской плате MSI MEG X570 Godlike.
Следующая фронтиспис →