投资界(微信ID:pedaily2012)4月2日消息,在2017中国(深圳)IT领袖峰会期间,腾讯董事会主席兼首席执行官马化腾,百度董事长兼首席执行官李彦宏,神州数码控股有限公司董事局主席郭为,微软公司全球执行副总裁沈向洋围绕“人工智能:中国基于与挑战”这一主题展开对话。
吴鹰:为什么重视人工智能?有什么看法?
马化腾:在公司内部结合业务形态我们已经有一些业务,比如微信朋友圈和QQ空间我们有上十亿的人脸照片,在国内有相当长的研究,包括后台数据分析,都用上人工智能技术,只是大家感受不到,这是在后端,在前端希望做出一些产品。
AlphaGo通过人机对战的事件让全世界对人工智能的认知到了新的高潮,团队也本着练手的心态做尝试。Google收购的DeepMind团队论文发表之后,全世界原来做计算机围棋的团队走入瓶颈的团队都用人工智能的方式来做,纷纷采用深入学习的方法融入到围棋的软件开发。
绝艺赢得比赛是小小的成功,不能过于欣喜,但是也不能说这是一个毫无意义的事情。
过去对AI很多从一些规则或者简单的训练得出来能够改善计算处理的能力,最终发现一个更同步和更深层的意义,能够在计算机的后台用云计算大数据的方式去高速学习,可以自己跟自己对弈。
围棋以外的,金融、医疗、病理的检测,如果用计算机后台做出模拟器,充分的尝试,就如自动驾驶一样,模拟做各种各样的反馈,自然会琢磨出一套理论和经验。以后在很多领域如果能做出模拟器定义参数自己学习,找到规律的能力远超我们想象的,这是我们得到最大的启发。
吴鹰:作为微软人工智能事业部的负责人,什么人工智能这几年能有突破性发展,预测一下最可能在哪些领域出现颠覆性的应用?
沈向洋: 我学习人工智能,有20、30年时间了。90年代中毕业的时候出来的时候工作都找不到,现在大家恨不得见到一个懂人工智能都投钱。人工智能之所以今天有这样的发展机会,主要还是因为三个方面原因,
第一,是因为互联网的出现,互联网+物联网提供了更多的数据。
第二,强大的运算能力。
第三,过去五六年深度学习突然突破,
人类感知这件事情上,人类的智能体现在哪?主要是两方面,一个是感知方面、一个是认知方面。
第一方面是感知方面,在接下来5-10年进展会非常快。具体表现在计算机语音和计算机视觉发展,我觉得AI会超过人。
第二方面是认知方面,包括自然语言,知识的获取、解决问题方法的思考、情感,这些东西今天我们还都是不知道。
我觉得从微软公司来讲,我们觉得短期之内是有非常非常大的商机,从我们来讲最大的商机在哪,就是每一个商业应用都会被颠覆掉。
吴鹰:郭为先生,你是神州数码的掌舵人,你们在智慧城市方面有很大的布局,很多人会认为你们好像跟人工智能不一定有那么大的关系。请你谈谈你对人工智能的看法。
郭为:
我们认为中国目前在算法上还处在在学习阶段。我们作为一个传统企业转型,唯一能做的就是数据。
由于我们以前的积累,使得我们能够接触大量的数据,这些数据如何从传统的方式上转移到用互联网方式,如何在三网环境下采集数据就变成我们的核心竞争力,这是不断探索的工作。
我们跟北大合作,在深网挖掘上有很大的变化,发明了相关技术,使得快速生成API,为智慧城市打造了一个基于大数据操作系统。如何能够快速形成一个城市数据,然后进行分析、应用,这就是做智慧城市的实践。
总的来讲,既要发挥神州数码在传统IT领域的应用上的特征,又要拥抱互联网,拥抱大数据。
吴鹰:从百度角度你能不能谈谈关于人工智能发展你们的看法,当年你们为什么那么早做这些布局?
李彦宏:
从百度的基因来说,我们从一开始成立到现在最主要是做搜索。搜索本质上是机器试图理解人想要的东西。深度学习在图像检索里头的效果不错,而且随着互联网这么多年发展,数据越来越丰富,计算资源越来越便宜,越来越强大。因此,我觉得它是代表一种趋势,对很多其他计算机科学要解决的问题都是非常有用的。
我在美国读书的时候,我就很喜欢人工智能这门课,但是学完之后,教授告诉我说其实没用,将来靠这个是找不着工作的。到现在最近几年,原来认为没用东西变成有用,是因为市场环境变了,条件变了,原来认为不可能的事情现在变成可能了。
我们在2013年1月份对外宣布成立深度学习研究院,这个可能是全球工业界第一个用深度学习来命名的这么一个研究院。我们是一个商业公司,按常理说不应该成立单独的研究院,研究应该跟产品部门、业务部门紧紧结合在一起。
但是深度学习我觉得是完全不一样的东西,需要在理论上、在算法上,在很多方面有长远的布局和突破,所以从那个时候开始大规模投入去吸引人才,去推进算法,去研究各种各样芯片结构层、CPU到GPU等。
现在看来,人工智能是一个远超我们当初想象的巨大产业。互联网其实现在只是一道开胃菜,真正的主菜是人工智能,所以人工智能不是互联网的一部分,不是互联网第三个阶段,它是堪比工业革命一个新的技术革命。
吴鹰:沈博士,微软如果进入中国人工智能市场的话,BAT,你最想干掉谁?
沈向洋:
微软在中国最近这几年推出的最了不起的人工智能叫微软小冰,我们的用户群是18-24岁相对的年轻用户群,大家有时间和智能聊天机器人,这也是为什么我们选择跟Pony这边的QQ合作。
大多数人一天讲的话很多都是废话,但是讲话却是人工智能里面最重要的一件事情。你的讲话在很大程度上体现这EQ。我们现在研究和产品的方向就是所谓的对话式人工智能。
吴鹰:人工智能会在仿生人脑上有所突破么?
郭为:
人还是太神奇了,这个我觉得人工智能很难达到人脑的程度,完全替代人不可能,某些替代就是功能上的替代,所以突破就在功能上的替代,然后提高一定的效率。人在进步的过程中不断发明新的工具,而新的工具最终还是为人类服务的。
马化腾:
我们期待有本质性的飞跃,但其实现在AI都是圈定一个比较窄的领域,通过各种参数训练,属于很窄的技能模拟,现阶段要研发出通用的AI很难。
从现在的研究状态到下一步实现通用人工智能,是不是能够超越当前的碳基智慧,是不是其他的元素有可能形成更高级的生命和智慧,超越人类现在发现的知识,这些是有可能的。
李彦宏:
其实我不太认可人工智能现在做的是仿生学。
我同意现在的人工智能,尤其是机器学习、深度学习的算法还确实处在非常初级的阶段,还有很多提升的空间,现在做得还非常不够。
第一阶段是弱人工智能,第二阶段是强人工智能,第三阶段是超人工智能,我认为到强人工智能这个阶段就达到不了,不仅仅是你永远搞不清楚人脑是怎么工作的,你即使用电脑的方法模拟人脑,要想完全达到人脑的水平,我觉得也做不到,永远做不到这件事情。
沈向洋:
今天计算机体系结构,冯诺伊曼结构,跟人脑结构完全是两码事。但在不远的将来人工智能能够做到人类能做的大多数事情。
大家觉得激动人心是因为以前是完全符号式、公式,而今天是神经网这样一种解法。用符号式做法解了一个问题,是可以懂的,可以解释的。而神经网解法,很难去解释为什么。接下来有一个需要研究的问题,从符号式到神经式怎么再回到符号式。这就是研究行业很热门的方向,叫做可以解释的人工智能。
吴鹰:百度的深度学习有一个免费开源平台,你们当年决定这么做的时候,你们不觉得这样开放后会培养你的竞争对手吗?
李彦宏:
人工智能是一个非常大的产业,而我们现在的判断未来20-50年都会是一个快速发展的人工智能时期。在这种时代大潮下,显然不是一个公司能够把所有的事情都做下来的。
我们先进入了这个领域,如果能够提供一些平台给一些尤没有这么多计算资源或是长远研发能力的机构,让他们有机会去做他们擅长的,就会推动整个人工智能技术的发展。
我们可以在平台上看到大家在干什么事情,哪些方向发展会更快一些,哪些领域更适用于现在已经解决的技术。
从这个意义上讲,我们把平台开放出来,对大家都有益。
人工智能永远不可能超过人类的能力,但是当他逐步逼近人类能力的时候,会将一个一个行业颠覆掉。人和动物的区别就是人发明了工具,但是人发明了工具之后,要写一个用户手册告诉你这个东西怎么用。但是未来应该是机器、工具学习人的意图,这就是我希望用人工智能方法解决理解人的自然语言,以后人和机的对话、人和物的对话就变成一种自然语言的对话,这是未来几十年可能代表人工智能发展最大的方向。
吴鹰:大数据是人工智能非常重要的方面,你们有没有可能把数据分享出来,让创业公司大家来用。
马化腾:
这个问题在内部我们也有激烈讨论。
首先看人工智能我们关注那几块,第一个是场景。场景就是你想把这个技术应用在什么场景下,这是一个落地的很重要的地方。所以如果没有场景落地,没有平台支持,基本上就是空中楼阁。
第二个是大数据,大数据也是从平台、业务部门有大量实际运转数据才能产生出来。但是这里面很多大数据是垃圾数据,因为没有标签,每人做规划定义,用多好的算法也学不出来。数据清洗、标签化难度非常高,我们甚至要人工清洗,再让AI学习。这里面是一个混合结合的过程。
第三,计算能力,也就是你有云的资源,拿几十万核的计算能力,CPU、GPU,我们还是有这个能力的。
第四个,就是人才。通过一年我们也招了挺多的人,我们在微软、在西雅图还设置了一个实验室。
几个方面结合起来才有办法真正在某一个领域看到它的成效。
我们观察到很多的AI所谓的大拿们,他们更关注怎么落地。所以在我们内部在吸引人才的时候,他们往往也会问你们微信、手机QQ里面的平台数据能不能给他们用。但是事实上,BG、部门里面的平台他们也希望近水楼台先得月,数据就在身边流动,什么不能招人先研究一把,为什么给你呢?
我们现在还处在内部怎么把数据分享出来这个阶段。这里面还有一个用户很关注的个人隐私,担心自己的数据被卖了。个人隐私脱敏是一个很复杂的信息安全技术,你是无法根据数据倒推到哪一个人做了什么事情。
数据清理到什么标签才能给其他部门、其他外部合作伙伴?数据怎么用?业界还需要有一个标准,互惠互利交换,这是一个大方向,还有很长的路要走。
沈向洋:
让这些公司把数据拿出来,让初创公司或者其他公司去用,我觉得不是很现实。但是很多的数据如果我们花时间、精力做一点处理,然后让研究人员去用,完全是可以做到的。我们微软出了两个数据集,一个是计算机视觉标准方面的集,另外一个数据集是在自然语言。这样,大家在标准集下,不断把标准集数据越做越多。我们做的方法是用搜索引擎数据,非常小心处理过,包括很多隐私的问题等等。拿出一些数据让大家做研究是非常实际的,完全可以做到。
郭为:
今天BAT很大的优势就是在互联网上已经完全垄断了数据。客观讲只要他们不犯错误的话,别人是没有机会的。今天如果去跟BAT在互联网竞争,那是完全不可能的事情。