「科普」挑战DLSS和FSR，XeSS真的来了

正文

2021/11/11 16:30:49
类型：原创
来源：电脑报
报纸编辑：电脑报
作者：

【电脑报在线】上周末，Intel首次发布了ARC原型显卡搭载的XeSS超级采样技术的游戏实机演示，标志着8月在Intel ARC独显发布时宣布的几个特有技术都开始进入实用化阶段，也标志着ARC独显离进入量产又迈进了一步。

上周末，Intel首次发布了ARC原型显卡搭载的XeSS超级采样技术的游戏实机演示，标志着8月在Intel ARC独显发布时宣布的几个特有技术都开始进入实用化阶段，也标志着ARC独显离进入量产又迈进了一步。

那么，XeSS这个Intel用来挑战DLSS和FSR的自家超级采样技术，究竟是怎么回事？其效果如何呢？

实机演示，效果惊人

这次实机演示是在动作+塔防大作Riftbreaker上进行的。由于没有限制单位数量、场景宏大加上建模精细，粒子效果繁多，所以游戏实际上对显卡的负担是相当重的，随着游戏往后期发展，敌我双方的建筑、作战单位越来越多，离子爆炸特效也越来越多，越来越频繁，对帧率的影响也越来越大。

不过在演示视频中，我们可以看到游戏一直保持以较高的的帧率在运行，而原生4K、1080P、超级采样缩放后的4K画面的对比，经过XeSS超级采样处理的4K画面保持了较多原生画面的细节，同时比1080P的原生画面更为清晰，可见还是颇有功力和效果的。

1080PXeSS超级采样放大到4K后居然还比原生1080P画面更为清晰

XeSS，第一个“双引擎”超级采样技术

XeSS的全称是Xe Super Sampling，即“Xe 超级采样”，Xe指的是以ARC等为代表的新一代Intel图形芯片架构技术。

XeSS让我们开眼界的第一点是，它是目前业界第一个“双引擎”的超级采样技术。

我们知道，目前NVIDIA和AMD的超级采样技术基本都是一个技术路线进行推进，有着不同的适用范围。例如NVIDIA的DLSS是基于RTX显卡的Tensor人工智能机器学习核心，所以它也只能在RTX显卡上生效，支持的游戏需要进行预先学习训练，并随着学习训练的深入，而获得越来越好的帧率优化效果；而FSR是基于开源的Lanczos缩放算法进行优化后形成的新开源超级采样算法，理论上可以适用于所有显卡硬件，但究其根本还是“缩放”；而XeSS则不同，它在Intel自身硬件上，通过XMX（Xe Matrix eXtensions，Xe矩阵扩展）这个引擎来进行超级采样，XMX实际上是硬件核心，类似NVIDIA的TENSOR机器学习核心，因此XeSS实际上也是通过机器人工智能深度学习实现；而在其他硬件上，它则通过DP4a指令集来实现超级采样，效率和效果都会有一定折扣，但能够适应更多的硬件——注意，也不是“所有”图形硬件。

这让XeSS成为了业界第一个“双引擎”工作机制的超级采样技术。

DP4a指令集是Intel在11代酷睿推出时推出的“深度学习加速指令集（Intel DL Boost）”中包含的新特性，当时在Xe集成显卡上为神经网络推理提供了DP4a支持，首次为 INT8 数据类型提供原生支持，可将 AI 性能提升多至 5 倍。

DP4a通过对INT8类数据类型计算支持，大大提高了深度学习的效率

而DP4a随后又加入SM6.4的渲染核心技术，并添加到DX12的新特性当中。所以，只要支持SM6.4的显卡，理论上都会支持DP4a，从而也可以在显卡中适用XeSS这个人工智能机器深度学习的超级采样技术。

采用DP4a软件算法的XeSS效果略低于硬件XMX引擎的XeSS

那么，哪些显卡/CPU目前已经支持了DP4a呢？

AMD：RDNA2架构显卡、7nm Vega显卡，今后可能RDNA1也支持

NVIDIA：安培架构显卡、图灵架构显卡、帕斯卡架构显卡

XeSS，有啥新特性

Intel在为ARC独显开发超级采样技术的时候，就已经认识到：XeSS的主要目标，是在不损失任何帧或质量的情况下将图像提升到更高的分辨率，最终产生最高质量的渲染，具有最精确的照明，有最详细的阴影和反射效果，并以平稳的帧速率引入到场景中。

1.XeSS通过深度学习，将运动矢量数据考虑在内，以预测附近的像素并重建图像，不是简单空间缩放。

因此，举例来说，如果我们取10个帧，而且每个帧都是动态的，帧中的物体在移动，那么就很难正确地放大图像，因为一帧中的像素可能在下一帧中不存在了。这就是神经网络大显身手的地方，因为它们可以帮助找出丢失的像素，然后通过人工智能和机器学习从相邻的像素重新建立起来细节。这与只限于空间放大的FSR是截然不同的——FSR只能根据已经呈现的像素进行优化计算和缩放。

2.XeSS不需要针对每个游戏单独适配训练学习。

我们知道，最早的NVIDIA DLSS1.0作为人工智能深度学习的超级采样技术，是需要通过配置超级计算机的NVIDIA深度学习适配中心，做适配学习的。待适配学习结束，形成了不断自我优化学习的“套路”时，才会以新驱动的形式，下发到显卡上实现DLSS，并让显卡进一步自行优化DLSS效果。

而对于XeSS，每个游戏都不需要自己单独适配训练，类似DLSS 2.0这样的基于神经网络的广义技术。例如，在8月的Intel Architecture Day上展示的虚幻引擎演示版本第一次使用XeSS，但XeSS之前从未接受过升级演示的学习训练，但也仍然取得了比较好的效果。

这张虚幻5 XeSS超级采样渲染图并未经过特殊适配学习

3. XeSS机器学习分辨率更高，并将支持8K分辨率超级采样

DLSS训练的分辨率是16K，而XeSS实际上是32K。模型训练为“每像素64个样本参考图像”。这意味着每个X和Y轴都有8个样本，总共是32个，因此有效的分辨率是32K。64x SSAA是XeSS机器学习的目标质量。对XeSS的8K支持也在开发中。

4.XeSS 2.0和XeSS 3.0已经在路上。

英特尔承认XeSS在8月发布时并不完美。随着神经网络技术和英特尔ARC显卡开发的推进，XeSS 2.0甚至3.0版本都将问世，进行迭代优化。

5.XeSS有多种质量模式

XeSS和DLSS、FSR一样，将有不同的质量模式。性能模式是为了获得最高的FPS，但同时也带来了最明显的质量下降。质量模式以更高的内部分辨率呈现，以提供更好的质量，但在这个过程中牺牲帧率。但XeSS追求的是性能模式产生的图像质量是十分接近超质量模式,不需要过分牺牲视觉体验。

6.XeSS将会开源

XeSS技术将会开源，无论是XMX引擎还是DP4a指令方式，都将采用同一套API接口和SDK开发包，方便游戏开发者进行适配。

总结

从最新的演示我们可以看出，目前XeSS已经初步实现了其预期目标。而对XeSS的理解，我们可以概括为：Intel新的，可以通过硬件和软件方式实现相近效果的，基于人工智能机器深度学习的图像超级采样技术。

随着ARC显卡的临近，我们也有理由相近，未来随着超级采样技术的普及，越来越多的中低端显卡将会获得如今中高端显卡才有的游戏体验。至于实际效果到底如何，让我们等待Intel ARC显卡的上市吧。

本文出自2021-11-08出版的《电脑报》2021年第43期 E.硬件DIY
(网站编辑：pcw2013)

读者活动

48小时点击排行

编辑推荐

「科普」挑战DLSS和FSR，XeSS真的来了

论坛热帖