日前,让很多游戏玩家心心念念的 NVIDIA RTX 40 显卡终于发售了。RTX 4090 上架开卖的同时,NVIDIA 发布了新版驱动程序 522.25 ,不但支持新卡,还开启了 DLSS 3 ,并且针对一系列热门的 DX12 游戏进行了优化,性能提升幅度最大可达 24.6% 。同时,新驱动加入了大量针对 DX12 游戏的优化,包括着色器编译优化、CPU 负载降低,以及新的 Resizable BAR 配置文件,其中许多优化在高 CPU 负载下效果最明显,能够使 GPU 得到更大程度的利用。
该驱动为首批 DLSS 3 游戏和全新 DLSS 2 游戏打造。官方表示,DLSS 3 现已推出,至高可将 GeForce RTX 40 系列显卡的性能提升至 4 倍。如果您拥有上一代 GeForce RTX 显卡或笔记本电脑,则可以在每个 DLSS 3 游戏中使用 DLSS 2 超分辨率。
现在,驱动总裁最新版本已经支持 NVIDIA 的 RTX 4090 显卡驱动,大家只需要更新到驱动总裁最新版,就可以使用。
驱动总裁官网:https://www.sysceo.com/dc
RTX 4090 采用的是 AD102 核心,完整的 AD102 核心共有 18432 个 CUDA 核心(分为 12 组 GPC / 72 组 TPC / 144 组 SM )、576 个第四代 Tensor Core 张量核心、144 个第三代 RT Core 光追核心、576 个纹理单元、192 个 ROP 单元、18 MB一级缓存、96 MB二级缓存、36 MB寄存器文件。
英伟达表示,4090 显卡的性能至高可达 GeForce RTX 3090 Ti 的 2 倍;而在支持全景光线追踪技术的下一代游戏中,性能至高可达后者的 4 倍。此类突破性的性能水平可支持您畅玩全景光线追踪游戏,例如“传送门 (Portal)”RTX 版、NVIDIA Racer RTX 以及即将支持光线追踪 Overdrive 模式的“赛博朋克 2077 (Cyberpunk 2077)”。
GeForce RTX 4090 至高可将创意应用速度提升 1 倍。4090 新增了第 8 代 NVIDIA 双编码器,可支持提升质量、优化带宽的新一代 AV1 解码器,因此可将视频制作的导出时间缩短一半。通过将 GeForce RTX 4090 添加到家庭工作室设置中,编码的效率最多可提高 40% ,从而以更高质量进行直播。AI 工具将加速先前繁琐的任务,例如 Blackmagic Design DaVinci Resolve 中的转描任务运行速度目前在新款 GeForce RTX 40 系列 GPU 上比上一代提高 70% 。
此外,英伟达表示,工程团队设计了新的 DirectX 12 增强功能,可为海量游戏加速性能。这些优化在 CPU 受限的情况下效果更为突出,可使显卡得到更大程度的利用。在“刺客信条:英灵殿 (Assassin's Creed Valhalla)”、“赛博朋克 2077 (Cyberpunk 2077)”和“极限竞速: 地平线 5 (Forza Horizon 5)”中,游戏性能至高可提升 24% 。DirectX 12 优化适用于所有 GeForce RTX 显卡和笔记本电脑,但根据特定的系统设置和所使用的游戏设置,为游戏带来的改进将有所不同。
官方介绍:NVIDIA GeForce RTX 40 系列 GPU,为游戏玩家和创作者提供的体验穿越速度,不止于快。这一系列 GPU 由更高效的 NVIDIA Ada Lovelace 架构提供动力支持,可在性能和 AI 驱动图形领域实现质的飞跃。得益于光线追踪和更高的 FPS 游戏分辨率,玩家和创作者能够以更低的延迟体验栩栩如生的虚拟世界,探索革新的创作方式和远胜以往的工作流程加速技术。
RTX 40 系列显卡基于 Ada Lovelace 架构设计,为了纪念世界上首位女程序员 Ada Lovelace 而命名的。相比于 Apmere 架构,Ada Lovelace 架构提升十分显著。GPC 图形处理集群从 7 个提升至 12 个,计算单元从 84 个提升至 144 个;完整 AD102 核心拥有最高 18432 个 CUDA ,远超 GA102 核心的 10752 个;着色器渲染能力高达 83TFLOPS ,是上代 2 倍;光追算力猛增至 191TFLOPS ,是上代 2.8 倍。
简单了解一下 NVIDIA Ada Lovelace 架构的核心特点
1)采用 TSMC 4N 定制 4nm 工艺,晶体管集成度更高,规模更强;
2)RTX 4090 的 AD102 核心目前拥有 98304KB 的 L2 缓存,也就是 96MB ,相比之前 GA102 所拥有的 6144KB 也就是 6MB ,大约是后者的 16 倍。英伟达解释道,如此巨大的缓存,将为所有 GPU 相关操作都带来巨大的收益,尤其是光线追踪、路径追踪等复杂的操作收益最为明显;
3)Ada 架构采用了第三代光线追踪模块,具备 Opacity Micromap、DMME 以及 SER 等新技术,大幅度提升了光线追踪计算效率;
4)采用了第四代 AI 张量核心,支持 AV1 格式的双 NVENC 编码器;
5)支持全新的 DLSS 3 技术,在 DLSS 2 的基础上增加了 Frame Generation 帧生成功能,能够在 DLSS 2 的基础上将游戏帧率再翻倍,并且不影响整体画质。这一技术目前只有 RTX 40 系 GPU 支持;
6)面向设计师群体的升级:Studio、Racer RTX 以及 RTX REMIX;
7)英伟达在本次 RTX 40 系列显卡上首发了三款核心,分别对应 2 个产品系列和 3 个型号。包括 AD102、AD103 和 AD104 ,这三个核心分别对应 GeForce RTX 4090、RTX 4080 16GB 和 RTX 4080 12GB。
NVIDIA Ada Lovelace 的提升可以简单归结为三个方面:
1)工艺与设计改变:NVIDIA 利用台积电 4N 定制工艺和改良的电路设计进一步扩大了芯片规模,完整的 AD102 核心拥有 763 亿个晶体管和 18432 个 CUDA 核心构成,运行时钟频率可以达到 2.5 GHz以上。在进行部分取舍之后,量产成行的 GeForce RTX 4090 的 TGP 功耗与 GeForce RTX 3090 Ti 相当,但效率翻了数倍。
2)更快的光线追踪性能:第三代 RT Core 拥有 2 倍的射线三角形求交吞吐量,并添加了两个硬件单元,分别是微映射透明度引擎(Opacity Micro-Map,OMM)和微网格置换引擎(Displaced Micro-Mesh,DMM)。其中 OMM 主要作用优化光线追踪渲染,降低着色器负担,DMM 则是将用于光线求交加速的层次包围盒加速算法(Bounding Volume Hierarchies,BVH)的速度提升 10 倍,显存占用减少 20 倍。
3)NVIDIA DLSS 3:第四代 Tensor Core 与光流加速器(Optical Flow Acceleration,OFA)配合,实现 AI 帧生成,从而使得 DLSS 3 相对 DLSS 2 帧率提升 2 倍,相对原画质帧率提升 4 倍,并与 NVIDIA Reflex 配合实现更低的系统延迟。
RTX 4090参数规格如下:
GeForce RTX 4090 在游戏领域已经是当之无愧的至尊卡皇,在比起上一代 RTX 30 系列性能巨幅提升的情况下,光线追踪性能和 AI 能力更加出色,先进的第四代 Tensor Cores 再搭配上革命性的游戏技术 DLSS 3 ,使得 GeForce RTX 4090 迎战未来 8K 光线追踪大作成为现实,并且 RTX 40 系列 GPU 拥有极高效率的生产力创作能力,强大的 CUDA 核心以及全新的编码器让内容创作者也可事半功倍,达到了市面上其他竞品无法企及的全新高度,对于高端游戏发烧友和生产创作者来说,GeForce RTX 4090 必定会是工作和娱乐的最佳搭档!
以上就是NVIDIA RTX 4090显卡开售,新驱动也随之发布文章,关注我们官方抖音号【系统总裁网】,可以学习更多电脑知识!