丹棱街微软1号大楼前,“微软”第八代小冰的年度发布会在这里进行。
但这一次,“微软”要打上一个引号,因为这次发布会虽然还是在微软中国的大楼举行,发布会期间也有很多微软(亚洲)互联网工程院的人士参加,但小冰实质上已经完成独立——它已经脱离微软,由原来微软的部分项目同事组成了一个新的公司,而微软公司对这家创业公司持股。
值得一提的是,2014年5月29日的*代小冰发布会就在这里举办。时隔六年,历经八代产品,之后小冰的发布虽然有几次走出去,但回到微软大楼的小冰,让我们还是会有一种亲切感。“回到这里,我们觉得有一种回到小冰娘家的感觉。”微软全球资深副总裁,微软(亚洲)互联网工程院院长王永东在发布会开场中称,“今天是这样,我相信以后也会有这种感觉。”他补充说。
换句话说,这场实际由小冰独立公司主导,微软内部人士协办,资本圈朋友参与的发布会,实际上更像是一场温馨的告别。有人甚至调侃称,它更像是一场“嫁女儿”式的发布会。
让我们简单回顾下一个月前:7月13日,微软中国正式宣布,人工智能小冰业务将分拆为独立公司运营,新公司委任沈向洋博士担任新公司董事长,李笛为首席执行官,陈湛为日本分部总经理,所有相关工作将在接下来的几个月内完成。
据PingWest品玩了解,新公司将更聚焦,公司放弃了美国和印度业务,主要业务也由原中国和日本的业务单元组成,目前新公司员工实质上已经脱离微软编制,过不了多久,他们也将离开微软大楼,搬进坐落在北京大学旁的硅谷大厦,新公司的员工大多也是由小冰公司董事长,原微软全球执行副总裁沈向洋和小冰团队总负责人,原微软(亚洲)互联网工程院副院长李笛从微软招募。
这也意味着,员工们放弃了原来坊间传言的那种更“work life balance”的宽松就业环境,进入到一个创业氛围更强的新公司中。
第八代小冰的突破
作为主打EQ情感交流类的人工智能助手,小冰一直认为,它与其他强调任务式的人工智能不同——人工智能无论在什么样的场景里,它都需要一个更长存的交流体验,它必须要跟你之间建立长存的纽带,并且它是为你而生的。
在技术路线上,沈向洋总结过小冰的成长历程:*代小冰非常简单,基本上是基于文本、搜索来做简单的对话系统;第二代多一些不同的落地场景,可以让她有更多机会学习;到第三代的时候,她应该有不同的感官,除了文本以外,还有语音、视频、机器视觉等;到第四代,知识图谱的重要性显现,因为只有通过知识图谱才能做更多IQ方面的尝试;从第五代开始有了框架的概念,开始考虑人工智能和世界之间的关系,开始做人工智能创造的布局;第六代时,这个框架已经开始逐步成熟;而第七代整体的框架有了飞跃的进步。
而在这角度之上,微软依靠小冰的技术框架搭建与人沟通的产品。
在这次发布会之前,小冰最近的一次公开测试是5月20日。那天,小冰在华为手机里做了一次没有任何预告、也没有任何宣传的测试,即通过小冰框架根据每一个人的不同需求下建立一些“虚拟男友”。
技术框架拟合了人类情感,被认为是小冰不同于其他人工智能对话助手的重要特性。“即使是小冰,也没有办法和这些单点的、每一个高度定制的虚拟人类相提并论的,这才是人们真正想要的虚拟人类。”李笛称。
之所以实现了长交互的对话,从技术领域来看,小冰更注重对话引擎的设计。小冰*个提出了预测、保持和诱导技术,过去数年小冰已经提出生成模型,共感模型和主导对话模型等技术。
而第八代小冰本身的技术框架也迎来升级。比如分层话题图谱,使小冰框架中的人工智能主体在引导对话时的全程完成率突破42.7%,“我们相信这个水平已经相当于我们之中非常懂得套路的人类了。”
可以理解为,小冰内部拥有一个非常庞大的数据原型,她就像是各种人的合集,而每一个人是她的一个子集,今年小冰通过样本学习,可以更精确得锁定一个子集。“过去打造一个风格原型时,必须基于至少5亿句的语料库进行过滤和筛选,现在我们也可以使用3000句具有鲜明风格的语料,去精细的训练风格模型。”有了这样的技术,小冰框架才能迅速的生产非常大量的虚拟人类。
而新技术——篇章内容主动学习技术,使得小冰主体的对话训练不再只依托于搜索引擎,他也可以更专注于你们之间过往的对话。
最新的一个功能是,你可以通过给它转发文章链接来引导学习,比如给它转发一篇高考时间确定的新闻稿,当你在询问它今年高考安排时,它就会告诉你你之前跟他聊过的高考相关安排——注意,它会转述,而非直接copy原文。
对于小冰来说,针对C端的产品免费开放,一方面是为了展示和验证技术的能力;另一方面其实也是为了吸收流量和数据。
毕竟对于创业公司小冰来说,“主要的成本就是人力的资源和流量。”
而本质上,小冰如今算是一家靠to B业务营生的公司。
小冰团队商业负责人,原工程院人工智能创造及商业事业部总经理徐元春称,在小冰没有着手建立一个专门的销售团队的情况下,从第七代小冰开始,小冰的商业收入已经正式超过了1亿元人民币。
在八代小冰的发布会上,小冰加大了在垂直领域的深入力度:X Designer是更模块化的商业解决方案,它利用小冰过去开放的艺术设计能力,面向的是对图案和纹样海量设计有大量需求的行业用户,其所提供的生产工具平台,包含完整的设计能力,同时还有版权服务支持的模块。
X Musician也是一个模块化的完整音乐创作平台,过去小冰已经拥有了完整的端到端的作词、作曲、编曲的创作能力,而且这些能力已经达到工业级使用的考验——“我们任何一个人只要有一个简单的创作动机或者灵感,可以是一句简单的歌词,一段简单的旋律,甚至是一段简单的节奏,交给小冰,利用这个工具我们可以把它变成一个完整的音乐作品,而且支持修改,形成独立的知识产权。”
谈及小冰在面对其他语音助手的优势时,徐元春认为:首先,小冰成为了用户的*之选主要得益于小冰在某些领域独有的、*的甚至不可替代的技术。其次,在商业模式完全相同的情况下,如果小冰参与的话我们有70%的机会获胜,拿到订单。
进入到“无人区”
小冰的未来是什么样?
1975年,比尔盖茨成立微软时面临了一个类似的问题:计算机未来是什么样?
计算机刚刚出来的时候,IBM的董事长沃森认为这个世界也许需要5台计算机。而比尔盖茨则认为这个世界上*不会只有5台商用计算机,他预测每个人都会有自己的个人电脑,而且是微软软件。
“也因此,微软通过产品、商业的模式,成为了一家伟大的公司。”沈向洋称,这是1975年微软成立时的预判。微软当时进入了由它自己定义的一个全新领域。
而如今,对小冰来说,她也正在进入一个在一定程度上由她自己定义的全新领域,一个无人区。
在最新的探索中,小冰推出了“人工智能时代的Office”,免费面向个人用户:
X Writer:可帮助用户实现人工智能编辑和文本创作,比如你起了一个开头,可以直接召唤小冰续写,当你有了灵感,你可以再次接管。人们已经开始尝试在使用这款软件找写作灵感.....
X Studio:它是一款支持人工智能调音,歌声合成的歌手正式版软件,主要面向电台节目等主播。B站上已经有不少up主*时间试用了这款产品,目前都给出了正向的评价。
X Presenter:提倡演示文稿的人工智能3D实体交流,让演示文稿不再那么“干巴巴”。
谈及未来,沈向洋认为未来每个人都会有专属的、千千万万个AI beings,“所以我相信未来人工智能的发展可能很难真正绕开小冰框架这一步。”
李笛称,“从某种意义来讲,我们今天所做的小冰框架可以理解为一个去驱动各种各样不同‘人’的操作系统”,但从另外一个角度看,它也并非是操作系统,“这个框架也必不可少的要去控制、维护人工智能主体的生命周期。”
前面商务负责人提到“小冰参与的项目我们有70%的机会获胜”,李笛最后给我们补充的例子也让我们印象深刻。
小冰团队在日本跟罗森合作测试的时候,因为是*次上线,他们让“小冰”的人机对话相对自由一点,但上线后发现她与某一位顾客对话时显得不是特别有礼貌,当时罗森就急了,这在传统的日本企业中是*不允许的。后来小冰团队就对这一个case进行了追踪,后来他们发现这个顾客从第二天开始,他在罗森的消费反而增加了很多,而且和人工智能之间的交互也比以往高了很多。
“这个顾客原本认为我来的时候,‘她’就是一个店员,现在‘她’突破了这种关系,进入到了更深的关系。”