Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

Умный суперсемплинг, Рей-трейсинг в видеокартах и 19% рост IPC в процессорах

9415
8

Новые процессоры Alder Lake сочетают полноценные мощные ядра с маленькими энергоэффективными и сегодня Intel поделились подробностями о принципах работы новых гибридных процессоров. Новые гибридные процессоры и многочисленные оптимизации Intel позволят повысить IPC (Instructions Per Clock) за счет нескольких факторов, включая:

  • Кэш подсистемы предсказания ветвлений на 5 тысяч записей для более точного результата;
  • 64-килобайтный кэш инструкций оптимизирован хранить наиболее частые инструкции ближе, не обращаясь к внешней памяти;
  • Первый декодер длины инструкций Intel, который производит предварительную информацию для запроса;
  • Кластеризованный внеочередной (out-of-order) декодер, который позволяет декодировать до 6 инструкций за такт с сохранением уровня энергоэффективности;
  • Расширенный исполнительный модуль с 5 регистрами переназначения и 8 регистрами завершения инструкций, буфером на 256 внеочередных инструкций и 17 исполнительными портами;
  • Надежные функции безопасности, включая аппаратную защиту от кибератак Intel® Control- Flow Enforcement Technology (CET) и защиту от перенаправлений Intel® Virtualization Technology;
  • Реализация расширения системы команд AVX наряду с новыми дополнениями для поддержки целочисленных операций ИИ.

В сравнении с ядром Skylake, в сингл-треде энергоэффективное ядро Alder Lake предоставляет на 40% больше производительности при одинаковом энергопотреблении, или аналогичную производительность при уменьшенном на 40% энергопотреблении. Четыре энергоэффективных ядра без использования технологии Hyper Threading имеют производительность на 80% выше, чем 2 ядра и 4 потока Skylake, потребляя при этом меньше энергии или схожую производительность при использовании лишь 20% энергии от Skylake.

Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

Производительные ядра Alder Lake, ранее известные как Golden Cove спроектированы для уменьшения задержек и высокой производительности в сингл-треде. Новые производительные ядра обеспечивают большой скачок в производительности и лучшую приложений с большим объемом кода.

Архитектура производительных ядер расширилась в следующих направлениях:

  • Шире: 6 декодеров (ранее 4), кэш на 8 микроопераций (ранее до 6), 6 портов переименования/распределения (ранее 5), 12 исполнительных портов (ранее 10);
  • Глубже: больше файлы регистров, больше файлы физических регистров, более глубокий буфер переупорядочивания инструкций на 512 записей;
  • Эффективнее: повышенная точность предсказания ветвлений, уменьшенная эффективная латентность кэша L1, полная предикативная оптимизация записи кэша L2.

В сочетании с другими оптимизациями и нововведениями Intel обещают:

  • Рост производительности до 19% при тестах на большом количестве популярных приложений по сравнению с архитектурой Intel® Core™ 11-го поколения (Cypress Cove) при сравнимой тактовой частоте (общий показатель роста считается как среднее геометрическое);
  • Упор на параллелизм и наращивание исполнительного параллелизма;
  • Расширения Intel® Advanced Matrix – встроенные средства ускорения ИИ нового поколения, предназначенные для инференса глубокого обучения и повышения эффективности обучения. Они включают выделенные аппаратные модули и новую архитектуру набора инструкций для значительного ускорения операций перемножения матриц;
  • Оптимизации работы с приложениями, имеющими большой объем данных и кода, в том числе c точки зрения уменьшения задержек.

Раджа Кодури рассказал о новой графике Intel Arc и первом поколении производительных дискретных решений под кодовым названием Alchemist.

Intel поделилась подробностями о гибридной архитектуре Alder Lake и новой графике Arc

SoC Alchemist на базе микроархитектуры Xe HPG спроектированы для обеспечения высокой масштабируемости и вычислительной эффективности со следующими ключевыми возможностями:

  • До 8 слоев рендеринга с фиксированной функцией для DirectX 12 Ultimate;
  • Новые ядра Xe с 16 векторными и 16 матричными движками (называемыми XMX – Xe Matrix eXtensions), кэшем и общей локальной памятью;
  • Новые модули трассировки лучей с поддержкой технологий DirectX Raytracing (DXR) и Vulkan Ray Tracing;
  • Увеличение частоты в 1,5 раза и соотношения производительности на ватт в 1,5 раза по сравнению с микроархитектурой Xe LP за счет сочетания новой архитектуры, логического построения, схемотехники, технологии производства и оптимизации программного обеспечения1;
  • Производство с нормами технологического процесса TSMC N6. 

При разработке графики Intel использует подход, ориентированный на программное обеспечение:

  • Архитектура Xe создается в тесном сотрудничестве с разработчиками в соответствии с отраслевыми стандартами;
  • Первый высокопроизводительный игровой графический процессор Intel ставит во главу производительность и качество благодаря разработке драйвера с единым унифицированным исходным кодом для интегрированных и дискретных графических продуктов;
  • Intel завершила рефакторинг ключевых компонентов графического драйвера, в том числе диспетчера памяти и компилятора, что привело к повышению производительности в процессорозависимых играх до 18% и уменьшению времени загрузки игры до 25%.

Технология XeSS

XeSS использует преимущество реализованных в Alchemist ускорителей ИИ для новой технологии масштабирования, которая обеспечивает высокую производительность и высокое качество изображения. Технология использует глубокое обучение для синтеза изображений, близких по качеству к рендерингу с высоким разрешением. Благодаря XeSS, игры, в которые можно играть только при низких настройках качества или разрешения, могут демонстрировать плавный игровой процесс с более высокими настройками качества и разрешения.

  • Работа XeSS заключается в реконструкции деталей на субпиксельном уровне из соседних пикселей, а также из предыдущих кадров с компенсацией движения;
  • Реконструкцию выполняет нейронная сеть, обученная обеспечивать высокую производительность и качество, с увеличением производительности в 2 раза;
  • XeSS обеспечивает суперсэмплинг на базе ИИ с помощью набора инструкций DP4a на широком списке оборудования, включая интегрированную графику;
  • Несколько разработчиков игр задействованы в работе над XeSS. SDK для первой версии XMX будет доступен независимым разработчикам программного обеспечения уже в этом месяце, а версия с DP4a будет доступна позже в этом году.