当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

8个月前 (03-19)Deepseek应用场景453

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

联想杨元庆:DeepSeek推动端侧智能部署,AI加速平民化

联想杨元庆:DeepSeek推动端侧智能部署,AI加速平民化

2月20日下午,在联想发布2024/25财年第三财季业绩后的媒体采访上,DeepSeek成为大家口中的高频词。“DeepSeek深远的影响力证明了一个大方向:人工智能不是只在云上,也以更高效的模式、跟...

Deepseek引发AI+变革浪潮 2025年AI行情可期

Deepseek引发AI+变革浪潮 2025年AI行情可期

本报记者 顾梦轩 夏欣 广州、北京报道2025年新年伊始,中国AI企业深度求索(DeepSeek)的开源大模型DeepSeek-R1在资本市场掀起巨浪。Wind数据显示,截至2月12日,万得Deeps...

多地政务服务便民热线相继宣布接入Deepseek 带来哪些变化?

多地政务服务便民热线相继宣布接入Deepseek 带来哪些变化?

央广网北京2月24日消息(总台记者任梦岩 晁向荣 黄东旭)据中央广播电视总台中国之声《新闻纵横》报道,大模型DeepSeek的火热扩展到了人们生活的方方面面,近日辽宁省级12345热线、广东省江门市1...

中国多地政务服务系统接入DeepSeek效率大增

中国多地政务服务系统接入DeepSeek效率大增

考消息网2月20日报道据台湾“中央社”2月19日报道,深度求索(DeepSeek)推出低成本且高效的大型语言模型掀起热潮,中国多地相继宣布政务服务系统接入应用,称可以大幅提升工作效率。以往要花一天时间...

清华团队推出“安全增强版DeepSeek”

清华团队推出“安全增强版DeepSeek”

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显...

AI数学天花板来了?DeepSeek新模型低调开源,网友直呼:R2指日可待!

AI数学天花板来了?DeepSeek新模型低调开源,网友直呼:R2指日可待!

就在所有人都在期待DeepSeek官宣R2大模型之际,公司却出其不意地在"五一"前夕投下了另一枚技术炸弹。4月30日,DeepSeek在Hugging Face平台上悄然开源了其最...