当前位置：首页 > 科技资讯 > AD102核心赋能，英伟达RTX 4070 Ti SUPER显卡德国领先上市，重塑图形处理标杆

AD102核心赋能，英伟达RTX 4070 Ti SUPER显卡德国领先上市，重塑图形处理标杆

发布时间：2024-07-27 00:16:12 作者：001资源网阅读：0次

7月4日消息，全球知名的图形处理解决方案提供商英伟达（NVIDIA）已低调启动了新款GPU——AD102-225的供货流程。

这款芯片被专门设计用于提升最新批次RTX 4070 Ti SUPER显卡的性能表现，尽管其规格与前代AD103-275相近，但在细节调校和工艺优化上实现了质的飞跃，有望为高端游戏及专业图形处理领域带来新一轮的性能革命。

现在，首款基于 AD102 的 RTX 4070 Ti SUPER 显卡已经在德国零售商处上架，显示售价 973.43 欧元（当前约 7617 元人民币），可能是占位符。

这款技嘉 RTX 4070 Ti Super Windforce MAX OC 16GB 显卡采用了 RTX 4090 同款散热器，并配备 RTX 4090 系列显卡中使用的 AD102 GPU，只是其 CUDA 核心数已经减少至 8448 个（RTX 4070 Ti SUPER 标准数据）。

相比另一款基于 AD102 的 RTX 6000 ADA（18176 个 CUDA 核心），该 AD102 GPU 至少屏蔽了 9728 个 CUDA 核心，相比 RTX 4090（16384 个）及 RTX 4090D（14592 个）也大量屏蔽。

技嘉 GeForce RTX 4070 Ti SUPER WINDFORCE MAX OC 16G（GV-N407TSWF3MAX-OC-16GD）

GPU：AD102-225

GPU 频率：2655 MHz（公版 2610 MHz）

尺寸：长 331mm，宽 136mm，高 55.5mm

GeForce RTX 4070 Ti SUPER WINDFORCE OC 16G（GV-N407TSWF3 OC-16GD）

GPU：AD103-275

GPU 频率：2625 MHz（公版 2610 MHz）

尺寸：长 261mm，宽 126mm，高 50mm

英伟达RTX 4070 10GB原型显卡：160bit显存与AD104-275 GPU背后的秘密

7月16日消息，英伟达在开发RTX 4070显卡的过程中，确实探索了多种配置选项，其中就包括一种配备10GB GDDR6X显存的版本。

英伟达RTX 4070 10GB原型显卡：160bit显存与AD104-275 GPU背后的秘密

然而，最终推向市场的RTX 4070选择了12GB GDDR6X显存和192bit的接口，这表明英伟达在综合考虑性能、成本和市场需求后，认为12GB的显存版本能够提供更好的用户体验。

闲鱼用户分享了一组 RTX 4070 10GB 原型卡的 GPU-Z 截图和实拍照，让我们有机会看到这款废弃方案的最初样貌。

GPU-Z 显示，这款显卡采用了 AD104-275 GPU，其中禁用了 AD104 芯片上的六个 32bit 内存控制器，因此仅保留了 160bit 的位宽，加上五个 2GB GDDR6X 显存芯片共 10GB 容量（18 Gbps）。

结果就是，这款显卡带宽和容量严重受限，带宽仅为 420 GB/s，相比现有 RTX 4070（2023 年 4 月推出）低 16.7%。

相对地，这款 10GB 原型卡提供了更多 CUDA 核心来弥补 VRAM 和带宽的不足，GPU-Z 显示它拥有 7168 个 CUDA 核心，比普通 RTX 4070 多 1280 个，刚好与后来推出的 RTX 4070 Super 数量相同。

此外，这款原型卡的 PCB 板上有着八个内存焊接位置，这说明英伟达当时很可能为其引入了 AD103（RTX 4080）板的参考设计。

英伟达RTX 5090 D旗舰显卡蓄势待发，预定2025年震撼上市

7月16日消息，X平台消息人士爆料称，英伟达正在筹备下一代的高性能显卡，命名为RTX 5090 D，预计将在2025年1月推向市场。这款显卡被内部称为"90 D"系列的一部分，是继RTX 4090 D之后的新一代旗舰产品，将采用Blackwell架构，基于台积电的先进制程技术。

英伟达RTX 5090 D旗舰显卡蓄势待发，预定2025年震撼上市

英伟达上代 "90 D" 卡 RTX 4090 D 于 2023 年末发布，2024 年初上市。换句话说，爆料者认为 RTX 5090 D 将在 RTX 4090 D 问世的一年后登场。

相较于原版 RTX 4090，RTX 4090 D 没有调整显存规格，仍是 384bit 21Gbps 的 24GB GDDR6X 显存，但核心规格出现了明显缩水：

RTX 4090 D 的 SM 数量从 128 组减少至 114 组，CUDA 单元从 16384 个减少至 14592 个（减少约 11 ％）。

此外，RTX 4090 D 的基础频率从 2.23GHz 微升至 2.28GHz，加速频率不变，显卡 TGP 功耗从 450W 降低至 425W。

从目前消息看来，RTX 5090 标准版显卡将配备基于台积电 4NP 定制工艺的 Blackwell 架构 GB202 GPU，搭载 448bit GDDR7 显存，功耗有望达到 500W。

英伟达革新AI微调范式：Llama 3借RankRAG框架力压GPT-4，重写大模型竞争格局

最近，一场人工智能领域的革新风暴正在悄然兴起，源自佐治亚理工学院与英伟达的杰出华人学者们，他们携手打造了一款革命性的微调框架——RankRAG。

英伟达革新AI微调范式：Llama 3借RankRAG框架力压GPT-4，重写大模型竞争格局

不同于传统RAG（Retrieval-Augmented Generation）流程的繁琐与冗长，RankRAG巧妙地将检索、排名与生成三大核心环节融合于单一的大型语言模型（LLM）之中，极大地提升了模型的工作效率与效能。

RAG（Retrieval-Augmented Generation）是LLM部署中常用的技术，特别适合需要大量事实知识的文本生成任务。通常，RAG的流程是：基于文本编码的稠密模型从外部数据库中检索top-k文本段，然后LLM进行读取和生成。这个流程已经被广泛使用，但也有局限，比如k值选择。如果k值太大，即使是支持长上下文的LLM也难以快速处理;如果k值太小，又需要高召回率的检索机制，而现有的检索器和排名模型各有不足。

基于上述问题，RankRAG框架提出了新思路：通过微调扩展LLM能力，让LLM自己完成检索和排名。实验结果表明，这种方法不仅提高了数据效率，还显著增强了模型性能。特别是在多个通用基准和生物医学知识密集型基准上，RankRAG微调出的Llama38B/70B模型，分别超过了ChatQA-1.58B和ChatQA-1.570B模型。

RankRAG的关键在于其高度的交互性和可编辑性。用户不仅可以实时查看AI生成的内容，还能直接在界面上进行编辑和迭代。这种即时反馈机制大大提高了工作效率，让AI真正成为创作过程中的得力助手。更令人兴奋的是，本次更新让这些Artifacts不再局限于Claude平台内部，用户可以轻松地将它们分享到任何地方。

这次RankRAG微调框架的创新还包括两个阶段的指令微调。第一阶段进行监督微调（SFT），混合多个数据集以提高LLM的指令跟随能力。第二阶段的微调数据集包含多种QA数据、检索增强的QA数据和上下文排名数据，进一步提升LLM的检索和排名能力。

在实验中，RankRAG在九个通用领域数据集上的表现始终优于当前的开源SOTA模型ChatQA-1.5。特别是在具有挑战性的QA任务中，如长尾QA和多跳QA，RankRAG比ChatQA-1.5提高了10%以上的性能。

总的来说，RankRAG不仅在检索和生成任务中表现出色，还在生物医学RAG基准Mirage上展示了其强大的适应性。即使在没有微调的情况下，RankRAG在医学问答任务上的表现也超过了许多专业领域的开源模型。

随着RankRAG框架的提出和不断完善，我们有理由相信，AI与人类协作创作的未来将更加光明。无论是独立开发者还是研究人员，都能利用这一创新框架激发出更多创意和可能性，推动技术和应用的发展。