又一家国产大模型企业加入“AI春节档”。加节档2月13日,上新市值MiniMax上线新一代文本模型MiniMax M2.5后,文本官宣该模型全球开源支持本地化部署。模型数据显示,暴涨模型上线不到一天,加节档来自全世界的上新市值用户已经在MiniMax Agent上构建了1万多个AI Agent。截至2月13日午盘,文本MiniMax股价大涨9.44%,模型报643.500港元/股,暴涨市值达到了上市首日的加节档2倍多。
![]()
据介绍,在编程能力方面,文本M2.5在权威榜SWE-Bench Verifie得分80.2%、模型Multi-SWE-Bench得分51.3%,暴涨较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Claude Opus 4.6,达到了行业最好的水平。更重要的是,模型展现出“原生Spec能力”——在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式。
工具调用和搜索能力方面,模型能够自动处理复杂任务,在BrowseComp、Wide Search等多项Agent任务中以更低的轮次消耗取得了更优的效果,相较于上一代模型表现提升20% ,达到了行业顶尖水平。
办公场景中,在Word、PPT、Excel金融建模等高阶场景中取得了显著的能力提升,在测评框架GDPval-MM与主流模型的对比取得了59.0%的平均胜率。
![]()
性能之外,M2.5的核心亮点在于极致的推理速度与成本控制。M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token。按每秒输出100 Token计算,连续运行一小时成本约1美元;若按50 Token计算,成本约0.3美元。这意味着1万美元理论上可支持4个Agent连续工作一年。
过去三个多月,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified成绩从69.4提升至80.2,进步曲线在同业中尤为陡峭。团队将这一跃迁归因于大规模Agent强化学习(RL Scaling)。MiniMax表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态-Agent Universe。当模型能力、泛化性和成本都不再是瓶颈,Agent渗透到工作和生活的各个角落——从编程、办公到创作、娱乐,大幅促进Agentic应用的进一步发展。
值得注意的是,国产大模型连日来集体上新,抢占“AI春节档”。字节跳动发布Seedance2.0,因为其逼真画面、电影级运镜在近日引发热议。阿里也正式发布新一代图像生成及编辑模型Qwen-Image-2.0。DeepSeek App更新新版本至1.7.4版本,网页端也同步进行了更新。面壁智能发布并开源了新一代全模态旗舰模型 MiniCPM-o 4.5。
采写:南都N视频记者 林文琪


评论列表
在客场3-0战胜费内巴切的赛后,执教森林队首场比赛即获得胜利的佩雷拉接受了采访。维托尔,恭喜你!执教诺丁汉森林的首场比赛就取得胜利,这场比赛有很多积极的方面,你最喜欢其中的哪一点?球员的实力。我要求他
2026-02-21 12:08提起岛国,人们首先想到的就是“AV”,在这个行业里,女优的地位很高,实现了真正躺着赚钱的梦想,然而真的会有很多女生对这个职业趋之若鹜吗?
2026-02-21 11:42前言麻绳专挑细处断,厄运专找苦命人。近日,孙鹏的妻子发布讣告,她的丈夫孙鹏,最终还是走了。医生早在两天前就想要去掉他的呼吸罩,可孙鹏妻子不同意,总觉得还有奇迹可能发生。回顾他的一生,那真的是比黄连还苦
2026-02-21 11:38进入2月,世界体坛将进入冬奥会时间。北京时间2月5日凌晨,冰壶混双项目将在冬奥会揭幕前打响第一炮。北京时间2月7日凌晨3点,2026年米兰-科尔蒂纳冬奥会开幕式将在米兰圣西罗体育场上演。 本届冬奥会中
2026-02-21 10:37