在11月8日的“2017全球硬科技产业化高峰论坛”上,思必驰CMO龙梦竹向来宾进行了题为“智联万物,智享未来”的主题分享,以下为发言实录:
大家好,今天提了非常多的硬科技,大多数跟硬件相关,今天我站在以语音交互为代表的软技术方面跟大家从另外一个角度带给大家新的思路。最近这几年,在人工智能风潮里大家都说语音是现在人机交互的入口,是下一代整个物联网发展的风口。
思必驰不是一个创业公司,我们到今年有十年的历史,从07年创业到现在一直做语音,但是思必驰二次创业2014年以后,把以前的教育事业部分拆转身投入物联网、移动互联网,专注于智能硬件这个领域,今天的思必驰应该是二次创业,我们还是以创业者的心态参与行业的浪潮竞争里面。
思必驰的名字并不是像讯飞那么名声在外,但是这个图片上所有的产品都是我们合作过的,包括未来汽车,小米的后视镜,包括很多家居车载的产品都有我们技术的身影,今天我的发言会基于思必驰现在的成就,给大家一些新鲜的想法。
在语言交互方面,音箱这是最近半年国内最火的产品,全世界来看,亚马逊的ECHO,从2014年面世到现在,全球销量超过了一千一百万台,大家可以把它当做AI的爆品,今年国内相继有非常多的智能音箱出来。从我们技术公司来看,音箱的火热只是一个偶然,现在说是智能音箱火热还不如说是助理设备终端的火热,音箱只是一个载体,是在家庭环境下人跟其它设备进行交互,最天然的一个载体,所以音箱基于这样一个契机开始被大家所追捧。
智能助理设备终端,除了音箱有没有其它的选择,这个答案是显然意见。人机交互一定是基于场景下,基于任务驱动,针对不同场景、不同的需求,不同的人群完全有更多的创意而做产品的选择。这里面有的是现在客户的案例,包括前面投资市场看的方向,第一个产品是我们在车载环境下的抬头显示器,操作是外在的设备放在操控台,用虚拟屏展现交互的内容,我们可以把这个称之为在承载环境下的ECHO,可以在开车环境下的智能助理设备终端,比如很多智能电视,带原厂交互,是不是有屏的大型ECHO,可以承载更多图象信息内容的智能助理设备终端?
音箱只是比较不错的选择,但不是唯一的选择,整个ECHO之所以卖那么好,并不是音箱本身有多么的刚需,而是基于背后的Alexa平台。之前在清科另外一个活动分享了一个叫《偶然的ECHO,必然的ALexa》的主题,万物都可以成为ECHO,只是你的产品定义是什么,受众、主打场景是什么。亚马逊推出ALexa这个平台以后,有很多平台也陆续出,它带给我们这种公司最大的触动是:原来技术可以这么玩。我们在探索平台这条道路上,到今年正式发布DUI平台为止一共探索了四年,13年我们建立的只是简单的平台,后来发现利用量太大,场景太复杂,于是把对话工厂的平台关闭,推出了AIOS操作系统,在今年9月7日我们推出了DUI对话定制平台。这个平台最大的特点是,语音语言交互是非常长的链条,从前端、后端,还有背后的第三方内容服务,一连串的叫语音交互。
最近有一个电视很火叫做《三生三世十里桃花》,有个客户希望我们把热词放进去。我们会搜集客户的需求,某一个时间定时迭代,可能这个版本没有迭代结束,客户下一个需求版本又来了,面临最大的问题就是我们提供定制的效率和客户需求的速度不吻合。不管你做什么,只要是定制一定要花时间和精力,对技术厂商来讲,对客户有门槛选择,现在大部分业内的技术公司,对大客户趋之若鹜,对中小开发者稍微冷淡,因为大家相互理解,在同样的精力耗费之下,在过去的解决方案里,大公司得到的回报多过中小型开发者,投入却是一样的。
刚才说到热词更新,可能用的不是A的芯片,而是B的芯片,可能有不匹配的问题,有的用户是数据的反馈,开发者关心是否能看到,对于这种在技术提供商和产品开发者之间的矛盾,我们平台可以定制规模化,把以前给产品定制方案的过程,完整地还给开发者,他只是需要自己开发;另外是全链路定制,一系列的都可以做定制分段的连接,整个平台是面向中小型开发者提供的。当然站在行业的角度,做相关平台的,国内有50多家,这里面有一些是具有一定能力的,比如技能的能力,底层SDK的能力,但是真正有能力做全链路定制开发的,国内目前不超过三家,而思必驰就是其中一家。这样的定制规模化和全链路定制的技术服务之后有哪些领域会被引爆?从语音交互的领域包括现在定制开放的哪些场景率先被带动起来?
第一个是传统APP的升级。不管你是电商还是搜索引擎,语音这一块可以带动传统APP,互联网业务的提升,对语音的需求来讲,是相对简单化,因为硬件本身,没有特别多定制的需求;第二个是家居。这个无需多说;另外一个是出行。这里是出行,而不是车载,这个车型既包装前装汽车还有后装的设备,后装设备包括单独的后视镜等,基本上都跟语音交互,言语交互有关系。还有其它的几个行业,比如智慧教育,教育在国内来看,做得最好的还是科大讯飞,包括高考把语音的评测,把机器的评测加到教育里面;再就是医疗。医疗领域里面用得比较多的就是用语音识别的办法录入电子病理,随着语音信息的副信息识别能力的提升,可能语音技术在医疗领域里有更深的应用,甚至可以用图像检测做一些诊疗辅助;还有就是客服,包括医疗诊疗的客服,政企服务类,个人助手,包括公司、银行咨询业务,表现形式可能是APP,也可能是机器人,还可能是小的设备,但从整体来说,智能服务最近几年会有特别大的提升。
讲到未来的发展用三个词概括,一个是融合,整个行业会发生一个融合。我们以前做创业,是以产品为出发,未来是以用户和场景化为出发;第二个是创新,很多新的产品都会基于场景化;第三个是重构和重塑对现在移动互联网的服务,包括医疗等其它服务。