架构、思考、执行三重突破，解读云知声U2模型核心竞争力

2026-06-25 17:29 网络

在大模型技术持续深化落地的当下，行业发展重心逐步从参数规模扩张，转向智能效率与使用价值的双重提升。云知声提出“高智能密度×高Token价值”的技术理念，发布自研U2大模型完成底层技术重构，通过创新模型架构、优化推理逻辑、强化原生智能执行能力，实现模型性能、推理效率与落地实用性的同步跃升，为大模型高效、低成本适配各类复杂场景提供全新技术路径。

传统稠密模型往往依赖不断扩张参数规模提升能力，而U2从设计之初便采用了稀疏MoE架构。每次推理过程中，模型只激活完成当前任务所需的专家网络，而不是调动全部参数参与计算。知识存储与知识调用被有效解耦，使模型能够在更小的激活参数规模下维持高规格任务能力。

当然，这些仅仅依靠更高效的架构还远远不够，这就要从根本上解决“思考”的问题。今天许多推理模型都存在一个共同问题，为了得到正确答案，会生成极长的思维链。模型看起来思考得很认真，但大量Token实际上消耗在中间过程，而不是最终结果上。

U2则采用了隐式思考机制。传统模型需要将每一步推理都转化为自然语言Token，而U2能够直接在连续隐空间中完成大量中间推理，仅在关键决策节点切换回显式推理进行验证。简单理解为，就是先在内部完成大规模探索，再将真正有价值的推理结果呈现出来。具体到医疗场景中，一份病历生成任务，传统模型往往需要输出2000至3000个Token，而采用隐式思考技术后，U2能够将输出压缩到1000个Token以内，同时保持结果质量。

值得一提的是，U2选择尽可能将规划、执行、记忆、校验和纠错能力训练到模型内部。为此，云知声将模型原生Agent能力的提升与Harness的迭代优化纳入同一训练闭环，形成双向强化的协同演进机制。此外，云知声通过课程学习的核心直觉模拟了人类学习规律，并基于过程奖励信号识别出无效动作的同时，又能奖励“看似迂回但开辟关键路径”的高价值探索。因此，在金融研究、办公自动化和软件开发等复杂场景中，U2往往能够以更少轮次完成任务。当许多模型还在不断确认下一步应该做什么时，U2已经开始主动拆解任务、调用工具并推进执行。

云知声U2模型以先进稀疏MoE架构为基础，搭配*隐式思考机制与闭环原生Agent训练体系，完整落地了“高智能密度×高Token价值”的核心目标。依托全方位的技术革新优势，U2可深度适配医疗、金融、办公、软件开发等多元场景，为大模型规模化、高质量产业化应用提供坚实的技术支撑。

打开投资界APP 阅读全文

（免责声明：本文转载自其它媒体，转载目的在于传递更多信息，并不代表本站赞同其观点和对其真实性负责。请读者仅做参考，并请自行承担全部责任。）

资讯

7×24快讯

数据

会议

架构、思考、执行三重突破，解读云知声U2模型核心竞争力

相关资讯