当前位置:首页 > Deepseek最新资讯 > 正文内容

Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1

2个月前 (08-27)Deepseek最新资讯274

  IT之家援引博文介绍,CoreWeave 使用 Deepseek R1 推理模型,对比评估英伟达 Blackwell 架构 GB300 NVL72 和上一代 H100 GPU 的差别。归功于英伟达升级架构,增强内存和带宽,测试结果显示,GB300 在仅使用 4 块 GPU 的情况下,即可完成原本需要 16 块 H100 才能运行的任务。

  GB300 NVL72 平台支持高达 37TB 的内存容量(最高可达 40TB),并配备每秒 130TB 的内存带宽。该平台为减少 GPU 间数据分割次数deepseek,采用 4 路并行设计,并通过 NVLink 和 NVSwitch 高速互连提升通信效率。

  CoreWeave 指出,这不仅是 FLOPs 算力的提升,更是系统架构在实际业务场景下的效率跃迁。对于需要运行复杂模型的企业客户,GB300 NVL72 提供了更高的扩展性和更低的延迟,帮助他们更快、更经济地部署和运行 AI 服务。原文出处:Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H100 的活,感谢原作者,侵权必删!

标签: deepseek

“Deepseek R1 推理实测:4 块英伟达 GB300 能干 16 块 H1” 的相关文章

研究观点 中国生物科技行业 中国创新药物的DeepSeek时刻?

研究观点 中国生物科技行业 中国创新药物的DeepSeek时刻?

  汇丰前海证券中国医疗行业分析师柴欣然认为PD(L)1双抗具有成为抗肿瘤标准治疗的潜力,中国创新药物或迎来DeepSeek时刻。   中国生物科技是今年市场热度最高、持...

果然一到假期,DeepSeek 就发新东西了。。。

果然一到假期,DeepSeek 就发新东西了。。。

  春节前整了个 R1 震撼科技圈,昨天又卡着十一假期的 Deadline,发了个新版本 —— DeepSeek-V3.2-Exp 出来。   诶我有一计,不如多设定几个...

每日互动方毅2025数博会分享:用二十年数据智能实践,走出AI落地新路径

每日互动方毅2025数博会分享:用二十年数据智能实践,走出AI落地新路径

  8月28日,2025中国国际大数据产业博览会在贵阳隆重开幕。当天下午,在国家数据局主办的数据产业创新发展主题交流活动中,每日互动董事长兼总经理方毅受邀发表《无数不智:让AI把私有数据用...

国信证券-通信行业周报2025年第34周:DeepSeek V3.1发布,工信部

国信证券-通信行业周报2025年第34周:DeepSeek V3.1发布,工信部

  行业要闻追踪:DeepSeek V3.1发布,国产GPU芯片等加速突破。(1)8月21日,DeepSeek发布DeepSeek-V3.1,基于下一代国产芯片训练。DeepSeekV3....

Deepseek推荐全国旅游百强县市第97名:宁夏贺兰县

Deepseek推荐全国旅游百强县市第97名:宁夏贺兰县

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

DeepSeek刚押注FP8,英伟达就把FP4精度推向预训练,更快、更便宜

DeepSeek刚押注FP8,英伟达就把FP4精度推向预训练,更快、更便宜

  前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了 UE8M0 FP8 的量化设计,声称是针对即将发布的下一代国产芯片设计。   这...