8月12日,新华社研究院中国企业发展研究中心发布了《人工智能大模型体验报告2.0》,讯飞星火以总分1013分位列榜 首,在“工具提效指数”方面,讯飞星火更以350分的碾压优势胜出,大幅*第 二名15分。而在8月17日,学术权威《麻省理工科技评论》也刊发了《寻找最聪明的大模型:国内主流大模型能力深度评测》报告,结果新发布的星火2.0版本在八项测试维度斩获六项第 一,最终以领 先第 二名6.3分的好成绩勇夺头筹,成为了“最聪明”的中国大模型。
多个媒体一致认为,代码能力是衡量智商高低的核心能力,而恰恰,代码能力是构建星火“高智商”的底层能力。根据科大讯飞发布的《讯飞星火认知大模型用户报告》显示,星火的刚需使用场景中,代码编程的使用比例为10%。为了降低代码编程门槛,在星火V2.0发布会上,讯飞带来的智能编程助手iFlyCode 1.0,具备了丰富的代码功能、无缝融入集成开发环境( IDE )和专业的代码知识服务三大优势,而这不仅是专业工程师迫切需要的能力,也让更多新手或小白也能轻松用上,并且用好。
在发布会的演示中,刘聪院长一行代码都没敲,仅凭iFlyCode 1.0提供的设计建议、功能规划、代码生成与补齐等能力,就快速将“凌空手写”、“函数曲线”以及“贪食蛇小游戏”这些复杂应用当场实现了。讯飞董事长刘庆峰还补充道:“即便是一个比较有经验的代码工程师去完成这个需求,也需要半天到一天时间。应用星火iFlyCode1.0工具,在10分钟之内就可以完成这个需求,以后咱们编写代码也没有那么难了”。甚至零编程技术的外行也可以借助iFlyCode 1.0快速生成应用,前提是要有想法、有创意。
iFlyCode 1.0也可以赋能开发团队与企业提质增效,在讯飞内部研发效能平台对2000余名员工使用iFlyCode 1.0的统计中,iFlyCode 1.0帮助开发人员提升了30%的代码采纳率和编码效率,使得综合效率获得了15%的显著提高。对比于项目应用前后,每个开发环节都是一个新的提升和改变,让开发“质变”的同时也获得“智变”。
根据用户画像进一步可知,星火认知大模型目前的用户群体集中在互联网、科研教育、市场营销与媒体等行业,不少资深职场经验人士将其作为解放生产力的法宝,政策端也为大模型应用的规范化保驾护航。8月15日,网信办等七部门联合发布的《生成式人工智能服务管理暂行办法》正式实行,有助于国内头部大模型在往后的迭代过程中,能尽量在法律允许的大框架下,实现以用户需求为导向的智慧涌现与智力跃迁。
从5月6日到8月15日的“百日会战”中,讯飞星火在多个权威媒体评测中技压群雄,几乎实现了“大满贯式”胜利。如今随着代码等“高智商”能力的持续升级,讯飞星火以“最聪明”的姿态傲视于大模型江湖,也将引领人工智能应用走向行业“深水区”。