首个性能混合架构 Alder Lake,以及其搭载的两款全新的 x86 内核框架——能效核和性能核,以及英特尔硬件线程调度器;
全新的独立游戏图形处理器(GPU)架构 X^e HPG 微架构,这将是英特尔首款基于台积电 N6 工艺的 GPU;
专为数据中心打造的下一代英特尔至强可扩展处理器 Sapphire Rapids;
基于 X^e HPC 微架构的数据中心 GPU 架构 Ponte Vecchio;
全新的基础设施处理器(IPU);
oneAPI 工具包:提供一个开放、规范、跨架构和跨厂商的统一软件栈,让开发者能够摆脱专有语言和编程模型的束缚。
拥有 5000 个条目的分支目标缓存区,实现更准确的分支预测;
64KB 指令缓存,在不耗费内存子系统功率的情况下保存可用指令;
英特尔的首款按需指令长度解码器,可生成预解码信息;
英特尔的簇乱序执行解码器,可在保持能效的同时,每周期解码多达 6 条指令;
后端宽度(Wide Back End)具备 5 组宽度分配(Five-wide allocation)和 8 组宽度引退、256 个乱序窗口入口和 17 个执行端口;
支持英特尔控制流强制技术和英特尔虚拟化技术重定向保护等功能;
实现了 AVX 指令集以及支持整数人工智能操作的新扩展。
相比于目前的第 11 代英特尔酷睿处理器架构(Cypress Cove),在通用性能的 ISO 频率下,针对大范围的工作负载实现了平均约 19% 的改进;
呈现出更高的并行性;
搭载英特尔高级矩形扩展(AMX),内置下一代 AI 加速提升技术,用于学习推理和训练。AMX 包括专用硬件和新指令集架构,以显著加速矩阵乘法运算;
减少时延,对大型数据和代码体积较大的应用程序提供更好的支持。
高性能、双芯片、插座式的台式机处理器 ,具有领先性能和能效。支持高规格的内存和 I/O;
高性能笔记本处理器,采用 BGA 封装,并加入图像单元,更大的 X^e 显卡和 Thunderbolt 4 连接;
轻薄、低功耗的笔记本处理器,采用高密度的封装,配置优化的 I/O 和电能传输。
计算内部总线可支持高达 1000GBps——即每个内核或每集群 100GBps,通过最后一级缓存将内核和显卡连接到内存;
I/O 内部总线支持可高达 64GBps,连接不同类型的 I/O 和内部设备,能在不干扰设备正常运行的情况下无缝改变速度,选择内部总线速度来匹配所需的数据传输量;
内存结构可提供高达 204GBps 的数据,并动态扩展其总线宽度和速度,以支持高带宽、低时延或低功耗的多个操作点。
使用台积电的 N6 制程节点上进行制造;
多达 8 个具有固定功能的渲染切片,专为 DirectX 12 Ultimate 设计;
全新 X^e 内核,拥有 16 个矢量引擎和 16 个矩阵引擎(被称为 XMX,即 X^e Matrix eXtension)、高速缓存和共享内部显存;
支持 DirectX Raytracing(DXR)和 Vulkan Ray Tracing 的新光线追踪单元;
通过架构、逻辑设计、电路设计、制程工艺技术和软件优化,相比 X^e LP 微架构实现 1.5 倍的频率提升和 1.5 倍的每瓦性能提升。
X^ e SS是一种利用Alchemist的内置XMX AI加速、实现高性能和高保真视觉的全新升频技术。该技术使用深度学习来合成非常接近原生高分辨率渲染质量的图像。
目前,多家早期的游戏开发商已开始使用X^SS, 本月将向独立软件供应商(ISV)提供XMX初始版本的SDK,DP4a版本将于今年晚些时候推出。
英特尔加速器接口架构指令集(AIA)——支持对加速器和设备的有效调度、同步和信号传递;
英特尔高级矩阵扩展(AMX)——Sapphire Rapids 中引入的新加速引擎,可为深度学习算法核心的 Tensor 处理提供大幅加速。其可以在每个周期内进行 2000 次 INT8 运算和 1000 次 BFP16 运算,实现计算能力的大幅提升;