IT之家2月13日消息,暴降本压英伟达昨日(2月12日)发布博文,英伟宣布在 AI 推理领域的架构将“token 经济学”(Tokenomics)方面,其 Blackwell 架构取得里程碑式进展。理成
英伟达在博文中指出,缩至通过推行“极致软硬件协同设计”策略,暴降本压优化硬件在处理复杂 AI 推理负载时的英伟效率,解决了随着模型参数膨胀带来的架构将算力成本激增问题。数据显示相比上一代 Hopper 架构,理成Blackwell 平台将单位 Token 生成成本降低至十分之一。缩至
![]()
英伟达Blackwell架构将AI推理成本压缩至十分之一
行业落地方面,包括 Baseten、英伟DeepInfra、架构将Fireworks AI 及 Together AI 在内的理成多家推理服务提供商已开始利用 Blackwell 平台托管开源模型。
IT之家援引博文介绍,缩至英伟达指出,通过结合开源前沿智能模型、Blackwell 的硬件优势以及各厂商自研的优化推理栈,这些企业成功实现了跨行业的成本缩减。
![]()
英伟达通过结合开源前沿智能模型使企业成功实现了跨行业的成本缩减
例如,专注于多智能体(Multi-agent)工作流的 Sentient Labs 反馈,其成本效率相比 Hopper 时代提升了25% 至50%;而游戏领域的 Latitude 等公司也借此实现了更低的延迟和更可靠的响应。
![]()
Sentient Labs成本效率相比 Hopper 时代提升了25%至50%
Blackwell 的高效能核心在于其旗舰级系统 GB200 NVL72。该系统采用72个芯片互联的配置,并配备了高达30TB 的高速共享内存。这种设计完美契合了当前主流的“混合专家(MoE)”架构需求,能够将 Token 批次高效地拆分并分散到各个 GPU 上并行处理。
![]()
GB200 NVL72系统采用72个芯片互联的配置
在 Blackwell 大获成功的同时,英伟达已将目光投向下一代代号为“Vera Rubin”的平台。据悉,Rubin 架构计划通过引入针对预填充(Prefill)阶段的 CPX 等专用机制,进一步推高基础设施的效率天花板。


评论列表
北京时间2月20日,据《阿斯报》报道称,中国将与西班牙于6月进行一场友谊赛,这也将是双方自2012年后的首次交手。双方在历史上共有2次交手,中国均以输球告终,2005年,西班牙依靠托雷斯、哈维和华金的
2026-02-21 09:13《古龙风云录》游戏中存在着小魔星宝藏,这个宝藏的位置还是很好找的,各位玩家可以在万春流居附近以及杜杀居区域找到,大家一共可以收集到6个小魔星宝藏,大家可以去游戏中找找这个小魔星宝藏。《古龙风云录》小魔
2026-02-21 08:57阴阳师祈舞唤神爬塔活动5月24日正式上线了,开场前记得先领取神雀祝福,可以加不少buff。对于萌新玩家来说爬塔是一件很难受的事,但你没有好的式神也没关系,下面小编就为大家带来祈舞唤神爬塔难民阵容攻略,
2026-02-21 08:30今天小编为大家带来的是侠客风云传前传先天功内功怎么得,相信大家对侠客风云传前传这一游戏都有很大的兴趣,但是对于对于如何获得先天功和内功却又不是很清楚,或者是没有一个详细的攻略大全,那么下面就让小编带领
2026-02-21 08:29