林俊阳,阿里巴巴Qwen大模型技术前首席工程师,于3月26日晚离开公司数周后首次公开发表声明,深入分析了大型模型技术的下一步演进。
林俊阳指出,行业正经历从“基于推理的思维”向“基于智能思维(代理思维)”的转变。他认为,过去一年里,行业一直关注如何让模特“思考更久”,但未来的核心将是模特是否能够思考,从而“采取行动”,并通过与现实世界的互动不断完善其计划。
回顾Qwen开发历程:强迫“思考”与“指令”合并的痛苦
在他的文章中,林俊阳公开分享了球队在2025年初的努力和经验教训。当时,团队雄心勃勃,试图建立一个统一系统,根据题目难度调整推理水平。
然而,实践证明推理数据与指令数据分布差异显著,导致模型在强制集成后两方面表现平平:它显得多余且缺乏决策力,执行指令时不可靠且成本高昂。这一见解解释了Qwen后来独立发布Instruct和Thinking版本,为行业提供了宝贵的工程参考。
“良好思维”的新标准:能够支持有效行动是关键
林俊阳认为,推理链的长度并不直接等同于模型的智能程度。盲目追求长推理链往往会浪费计算能力。他预测未来研究与开发的重点将从单纯训练模型转向训练整个“模型+环境”智能体系统。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

本文由数智化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数智化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
