NVIDIA 在发表第三代 GeForce RTX 的 Ada Lovelace 架构,也宣布专属 Ada Lovelace 的 DLSS 3 影像强化技术,除了借助 AI 技术进行影像强化提升帧率,同时影像品质甚至可超越原生解析度,搭配 GeForce RTX 40 还可带来 4 倍的帧率提升,同时启用 DLSS 3 还可相较原生解析度减少 2 倍的延迟。
目前已经有 35 款游戏宣布导入 DLSS 3 技术,其中将在 10 月上市的「瘟疫传说:安魂曲」将抢得首发,而近日由於动画重新带动人气的「 电御叛客2077 」,以及微软模拟大作「微软模拟飞行」皆将支援 DLSS 3 技术。
▲ DLSS 2 仅需单一 AI 模型即可套用到所有游戏内容,不过开发者需在游戏启用或是导入对 DLSS 2 的支援
在 2018 年 NVIDIA 发表代号 Turing 的第一代 GeForce RTX 显示卡後, NVIDIA 借助架构中的 Tensor Core 带来的 AI 支援,为游戏内容开发 DLSS 技术,第一世代的 DLSS 技术需要针对不同的游戏逐一训练模型,但随着 DLSS 发展到第二代的 DLSS 2 ,已可使用单一 AI 模型套用到支援的游戏引擎,开发者只要使用相容 DLSS 2 的游戏引擎,开启项目後即可获得 DLSS 2 技术支援。
▲ DLSS 3 在 DLSS 2 的技术基础针对 Ada Lovelace 架构加入新技术
DLSS 3 是针对 Ada Lovelace 的第四代 Tensor Core 与 RT Core 当中新增的Optical Flow Accelerator (暂译:光流加速器)进行最佳化,故无法套用於前两世代的 GeForce RTX 产品。相较原本的 DLSS 技术的帧产生卷积自动编码器仅需输入目前与先前的游戏帧, DLSS 3 还加入由光流加速器产生的光流场与运动向量与深度等游戏引擎数据。
Ada Lovelace 的光流加速器可分析两个连续的游戏帧运算光流场,光流场捕捉画素自第一帧移动到第二帧的方向与速度,而光流加速器可捕捉包括粒子、反射、阴影、光罩等不包括游戏内运动像量计算的像素级资讯,并准确追踪反射等像素级效果。
▲ DLSS 3 最多可提升 4 倍游戏帧率
DLSS 3 同时将游戏引擎的运动向量资料用於精确追踪场景内几何体的运动,透过直接导入来自游戏引擎的资料, DLSS 的 AI 可决定如何使用游戏运动向量、光流场与连续游戏帧的资料产生中间帧,借助结合游戏引擎运动向量与光流进行运动追踪,使 DLSS 能正确地重建游戏的几何效果,藉此产生精确而流畅的游戏画面。
在启用 DLSS 3 後, AI 将透过 DLSS 超解析重建第一帧的 3/4 ,在透过 DLSS 帧产生重建整个第二帧,平均而言, DLSS 将重建总像素达 7/8 的画面,藉此减少 GPU 负担,大幅提升游戏流畅度。此外 DLSS 3 还整合 NVIDIA Reflex 技术,使 CPU 与 GPU 同步,降低游戏系统的卡顿与输入延迟,相较原生画面,启用 DLSS 还可减少达 2 倍延迟。
▲电御叛客 2077 不仅提升 4 倍效能,同时反应速度提升 2 倍
在即将透过更新支援 DLSS 3 的电御叛客 2077 ( Cyberpunk 2077 )当中,启用 DLSS3 相较原生解析度可提升 4 倍帧率,并借助 NVIDIA Reflex 使反应时间提升 2 倍。
▲在模拟飞行亦可提升 2 倍的效能
同时 DLSS 3 也能为 CPU 吃重的游戏带来相当的效能提升,借助 DLSS 将影像强化转移到 GPU 执行,例如由於场景庞大的微软模拟飞行,也可使游戏帧率提升达 2 倍。