“大模型带来了语音技术发展的全新机会。”
1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并正式发布星火语音大模型,推动万物互联时代下人机交互场景变革。
“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们目标和梦想一天都没有变。”科大讯飞董事长刘庆峰在发布会现场如是说。星火语音大模型所展现出的*性能,验证了科大讯飞在人工智能自然语音领域的深厚积累,也彰显了其在推动人机交互技术进步方面的能力与决心。
三大维度能力升级,星火语音大模型效果国际*
科大讯飞的智能语音技术持续走在世界前列,2023年以来,在DCASE工业声纹挑战赛、IWSLT国际机器口语翻译大赛、CHiME高噪音复杂多通道多人说话场景比赛、国际车载多通道语音识别挑战赛等涉及工业、高噪、车载等复杂场景的比赛中接连收获冠军。
与此同时,全球对语音大模型的研究开始快速升温,出现了新的颠覆性技术逻辑。基于海量的数据训练,大模型可以实现更精细的模型描述、更精准的语义理解以及更统一的多任务建模,这给语音技术的发展带来了全新机会。凭借星火认知大模型的持续升级,以及科大讯飞在语音属性解耦表征预训练等方面的深厚积累,基于“飞星一号”的国产算力平台,科大讯飞在几个月内迅速推出了讯飞星火语音大模型。
目前,星火语音大模型在语音合成层面提升了韵律表现力和拟人度,在语音识别领域突破复杂场景识别效果上限,在多语种层面提升语料稀缺小语种效果。“通过星火语音大模型的评测效果,我们非常自豪地告诉大家,科大讯飞继续保持了全球*的水平。”刘庆峰介绍,星火语音大模型效果国际*,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。
四大功能特性,重塑人机交互体验
在星火语音大模型的加持下,智能客服实现进一步升级,具备超拟人语音合成、情绪感知、复杂语义理解、业务逻辑推理四大功能特性,将重塑人机交互体验。
超拟人合成技术可以通过更精细的模型描述,提升智能客服的韵律表现力和拟人度,生成更像人、更生动的语音表达,实现近乎*的人机交互体验,为客服机器人的应用开辟了新的可能。
情绪感知能力使智能客服能够更好地理解和回应用户的情感状态。通过分析用户的语音语调、语速和表达方式等特征,智能客服可以判断用户的情绪是积极的、消极的还是中性的,调整自己的回答方式,以提供更加贴心的服务。
复杂语义理解能力让智能客服可以在较长的对话中,理解上下文的变化,对用户的需求提供更准确的反馈,并能通过提问的方式引导用户提供更多信息,从而解决复杂问题,提高用户满意度。语音打断功能允许用户随时中断智能客服的发言,这种灵活性使得用户能够更好地控制对话的进程,实现更加高效的交互。
业务逻辑推理能力使智能客服在接入客户问询时,能够理解用户意向及偏好,识别销售机会,引导相关产品或服务,以提供更为精准和个性化的体验,这一能力对于增强用户体验和提升服务效率具有显著意义,也可帮助企业在服务过程中实现潜在的业务转化。
“百”搭型选手,赋能实际行业应用
客服是人机交互的典型场景之一,也是各行各业的刚需场景。作为“百搭”型产品,星火智能客服在行业中的应用已经非常广泛。
以金融客户服务为例,当用户来电咨询关于理财产品或信用卡额度等相关问题时,智能客服能够迅速识别用户的多样化需求,并将这些需求与相应的业务模块相匹配,提供准确的解答。同时,在回答问题的过程中,智能客服还会运用专业的引导话术,如在收到用户咨询信用卡额度相关问题时,关联信用卡提额相关活动,引导用户完成业务办理,从而在一轮通话内完成从闲聊咨询到业务营销到业务办理的全过程。
星火语音大模型的应用远不止于客服领域,其广泛的适用性使其能够在各行各业发挥重要作用。例如,在汽车行业,星火语音大模型的集成将极大提升智能驾驶舱、智能座舱、智能导航系统以及音乐控制系统的交互体验,使之更加精准、高效。此外,陪伴机器人、导购机器人、辅助诊断机器人、智能家居设备以及穿戴式技术产品等领域,也将因星火语音大模型的加持而迎来新的发展机遇,进一步激发产业活力。
双重价值提升:用户体验与企业效率
技术价值的核心在于应用,而应用的成效需要看实际落地效果。目前,星火智能客服产品已经在科大讯飞内部上线使用,其应用价值不仅体现在提升用户体验,更在于帮助企业降本增效。
首先,星火智能客服较之传统智能客服,在复杂说法理解、拟人化交互层面具有较大优势,加之目前知识管理已实现文档级运营,能够实现24小时不间断的客户服务,端到端解决用户问题,提升用户体验。科大讯飞400客服中心,率先使用大模型文字客服,机器人自助服务率环比提升142%, 通过大模型赋能坐席,话后处理时长环比降低30%。
此外,星火智能客服能够自动学习知识库中的知识,处理大量重复性和常规性的咨询,话后可以自动生成工单小结,将坐席人员从繁重冗余的工作中解放出来,从事更为复杂和创造性的工作。这样的智能化分工,有助于降低企业的人力成本,同时提高整体的工作效率。再深一层,星火智能客服还能够从海量通话中提取共性需求,帮助企业更好地理解用户,优化产品和服务,在激烈的市场竞争中获得优势。
在智能语音领域,科大讯飞始终保持着行业领跑者的姿态。“如今,通过大模型的应用,科大讯飞能够赋予语音更多维度的特性,包括语种识别、内容理解、韵律把握、音色变化以及情绪表达等。”可以预见,2024年,由讯飞星火所引领的新一代人机交互模式,将全面开启未来交互新纪元。
*文中数据来源于实际应用