打开APP

架构、思考、执行三重突破,解读云知声U2模型核心竞争力

2026-06-25 17:29 网络

在大模型技术持续深化落地的当下,行业发展重心逐步从参数规模扩张,转向智能效率与使用价值的双重提升。云知声提出“高智能密度×高Token价值”的技术理念,发布自研U2大模型完成底层技术重构,通过创新模型架构、优化推理逻辑、强化原生智能执行能力,实现模型性能、推理效率与落地实用性的同步跃升,为大模型高效、低成本适配各类复杂场景提供全新技术路径。

传统稠密模型往往依赖不断扩张参数规模提升能力,而U2从设计之初便采用了稀疏MoE架构。每次推理过程中,模型只激活完成当前任务所需的专家网络,而不是调动全部参数参与计算。知识存储与知识调用被有效解耦,使模型能够在更小的激活参数规模下维持高规格任务能力。

当然,这些仅仅依靠更高效的架构还远远不够,这就要从根本上解决“思考”的问题。今天许多推理模型都存在一个共同问题,为了得到正确答案,会生成极长的思维链。模型看起来思考得很认真,但大量Token实际上消耗在中间过程,而不是最终结果上。

U2则采用了隐式思考机制。传统模型需要将每一步推理都转化为自然语言Token,而U2能够直接在连续隐空间中完成大量中间推理,仅在关键决策节点切换回显式推理进行验证。简单理解为,就是先在内部完成大规模探索,再将真正有价值的推理结果呈现出来。具体到医疗场景中,一份病历生成任务,传统模型往往需要输出2000至3000个Token,而采用隐式思考技术后,U2能够将输出压缩到1000个Token以内,同时保持结果质量。

值得一提的是,U2选择尽可能将规划、执行、记忆、校验和纠错能力训练到模型内部。为此,云知声将模型原生Agent能力的提升与Harness的迭代优化纳入同一训练闭环,形成双向强化的协同演进机制。此外,云知声通过课程学习的核心直觉模拟了人类学习规律,并基于过程奖励信号识别出无效动作的同时,又能奖励“看似迂回但开辟关键路径”的高价值探索。因此,在金融研究、办公自动化和软件开发等复杂场景中,U2往往能够以更少轮次完成任务。当许多模型还在不断确认下一步应该做什么时,U2已经开始主动拆解任务、调用工具并推进执行。

云知声U2模型以先进稀疏MoE架构为基础,搭配*隐式思考机制与闭环原生Agent训练体系,完整落地了“高智能密度×高Token价值”的核心目标。依托全方位的技术革新优势,U2可深度适配医疗、金融、办公、软件开发等多元场景,为大模型规模化、高质量产业化应用提供坚实的技术支撑。


(免责声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。请读者仅做参考,并请自行承担全部责任。)

相关资讯

【声明:本页面数据来源于公开收集,未经核实,仅供展示和参考。本页面展示的数据信息不代表投资界观点,本页面数据不构成任何对于投资的建议。特别提示:投资有风险,决策请谨慎。】