从GPT-5到DeepSeekV3.1,顶尖AI大模型的新方向出现了!

2025-09-01 16:19:37 来源:投资界    阅读量:5020   

随着推理模式日益复杂,完成任务所需的token数量正在暴涨,导致实际成本不降反升。业界正从单纯追求模型能力上限转向追求计算效率。目前,“混合推理”已成为行业共识,目的是要让模型学会判断何时需要“深度思考”,何时只需“快速响应”。

在AI大模型的激烈竞赛中,衡量标准正悄然改变。

从美团最新开源的龙猫大模型,到OpenAI下一代旗舰GPT-5和明星创业公司DeepSeek的新品,顶 尖玩家们不约而同地将目光投向了“混合推理”与“自适应计算”,标志着AI行业的发展重点正从“更高、更强”转向“更聪明、更经济”。

美团近日开源的“龙猫”凭借创新的架构,在性能比肩业界顶 尖水平的同时,实现了惊人的算力节省。

华尔街见闻此前提及,LongCat-Flash最 具创新性的设计之一是 “零计算”专家机制,该机制能智能识别输入内容中的非关键部分,如常见的词语和标点符号,并将其交由一个不进行复杂运算的特殊“专家”处理,从而直接返回输入,极大地节省了算力。

此举并非孤立的技术炫技,而是对当前行业痛点的精准回应——随着推理模式变得更加复杂,AI应用的成本正在快速上升。

业界的应对策略正在聚焦到一个共同方向:混合推理模式。这种模式让AI系统能够根据问题复杂度自动选择合适的计算资源配置,避免在简单任务上浪费昂贵的算力。

01

AI越“聪明”,成本越昂贵

美团对效率的极 致追求,恰恰反映了整个AI行业正面临的严峻挑战。

据机器之心,前段时间,TextQL联合创始人兼CEO丁一帆就指出了一个反直觉的现象 —— 明明Token的成本一直在下降,但各家模型公司的订阅费却在飞涨。

丁一帆认为,问题的症结在于,那些降价的模型大部分不是SOTA模型,而人类在认知上的贪婪决定了,大部分人只想要“最强大脑”,所以99%的需求会转向SOTA。而最强模型的价格始终差不多。

简单来说就是,虽然单个token的价格在下降,但完成复杂任务所需的token数量正在以前所未有的速度增长。

例如,一次基础的聊天问答可能仅消耗几百个token,但一项复杂的代码编写或法律文件分析任务,可能需要消耗数十万甚至上百万个token。

AI初创公司T3 Chat的首席执行官Theo Browne也曾表示:

“争夺最智能模型的竞赛,已经演变成了争夺最昂贵模型的竞赛。”

这种成本压力已传导至应用层公司。据媒体报道,生产力软件公司Notion的利润率因此下降了约10个百分点。一些AI编程辅助工具的初创公司,如Cursor和Replit,也不得不调整定价策略,引发了部分用户的抱怨。

02

顶 尖模型的共同答案:

混合推理

为破解成本困局,“混合推理”或称“自适应计算”已成为行业共识。

各大模型厂商虽然路径不一,但目标高度一致:让模型学会判断何时需要“深度思考”,何时只需“快速响应”。

OpenAI的GPT-5采用“路由器”机制,根据问题复杂程度自动选择合适的模型处理。举例来说,对于如“天空为什么是蓝色”的简单问题,GPT-5会直接将其交给轻量级模型,复杂任务则调用高算力模型。

根据OpenAI内部评测,GPT-5使用思考模式能以比前代模型少50-80%的输出token完成任务,达到相同或更好的效果。该系统通过用户行为、偏好反馈和正确率等真实信号持续训练路由机制,随时间不断改进。

DeepSeek的V3.1版本则更进一步,将对话和推理能力合并到单一模型中,推出了单模型双模式架构。开发者和用户可以通过特定标记或按钮,在“思考”与“非思考”模式间切换。

官方数据显示,其思考模式能在消耗减少25-50% token的情况下,达到与前代模型相当的答案质量,为企业提供了一个高性价比的开源选择。

目前,这一趋势已成为行业主流。从Anthropic的Claude系列、Google的Gemini系列,到国内的阿里Qwen、快手KwaiCoder、字节豆包以及智谱GLM等,几乎所有头部玩家都在探索自己的混合推理方案,试图在性能与成本之间找到最 佳平衡点。

有分析指出,混合推理的下一个前沿将是更智能的“自我调节”——让AI模型能够精准地自我评估任务难度,并在无人干预的情况下,以最 低的计算代价,在最恰当的时机启动深度思考。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。


Es916
相关推荐
猫眼数据:2025年暑期档票房、观影人次同比增长《南京照相馆

智通财经APP获悉,9月1日,猫眼研究院发布《2025暑期档数据洞察》。数据显示,2025年暑期档电影总票房为119.66亿元,同比增长2.76%,总观影人次同比上涨12.75%。20...

2025-09-01 15:45:33
石四药集团02005已取得乌拉地尔缓释胶囊30mg、盐酸尼卡

、盐酸尼卡地平氯化钠注射液(200ml)及盐酸屈他维林注射液(2ml)的药品生产注册批件) 智通财经APP讯,石四药集团公布,该集团已取得中国国家药品监督管理局有关乌拉地尔缓释胶囊(...

2025-09-01 15:11:38
国内首条穿越泉域岩溶区地铁试运行

8月31日,济南地铁4号线列车开启试运行。 8月31日,国内首条穿越泉域岩溶区地铁——济南地铁4号线开启试运行。济南地铁4号线沿济南东西向交通大动脉经十路敷设,全长约40公里。 8...

2025-09-01 14:08:49
海南将第四次赴港发行离岸人民币债券首设航天主题债券

记者9月1日从海南省财政厅获悉,海南省本月将在香港发行不超过50亿元的离岸人民币地方政府债券,这将是该省第四次赴港发债,并首次推出航天主题债券。 据海南省财政厅发布的公告,海南省政府...

2025-09-01 13:15:13
歌尔光学科技公司增资至10.6亿

天眼查工商信息显示,近日,歌尔光学科技有限公司发生工商变更,姜滨卸任法定代表人,由饶轶接任,同时,注册资本由约9.8亿人民币增至约10.6亿人民币。 该公司成立于2012年3月,经营...

2025-09-01 12:36:56
吉大通信:研发投入增23%,全面拥抱“AI+”与全球数字化浪

在通信行业全面数字化转型的推动下,吉大通信2025年中期报告反映出企业正处于战略性拓展阶段。作为国内知名的通信与信息技术服务商,公司致力于为全球运营商、政府机构及企业客户提供高技术服务...

2025-09-01 11:47:01
预计达119亿人次!“火热”暑运彰显“流动中国”新活力

交通运输部最新数据显示,预计今年暑运期间全社会跨区域人员流动量达119亿人次,日均1.92亿人次,同比增长4.3%。 今年暑运期间预计公路自驾出行量87亿人次,占全社会跨区域人员流动...

2025-09-01 11:23:49
嘉峪关新名片多措抓项目强工业提消费塑造发展新动能

我市全力抓项目强工业提消费塑造发展新动能持续巩固拓展经济回升向好势头 今年以来,我市紧紧扭住抓项目、扩投资,强工业、稳二产,扩内需、提消费,持续巩固拓展经济回升向好势头,努力为高质量...

2025-09-01 10:34:40