9月9日,由清科集团、投资界主办的第五届中国移动互联网投资大会在北京召开。在“人工智能改变未来”环节,IDG资本合伙人牛奎光与Sense Time CEO徐立进行了精彩对话。以下为对话实录:
牛奎光:徐立你好,Sense Time是一家挺低调挺神秘的公司,今天也请徐立跟大家介绍一下Sense Time是怎么来的。
徐立:非常谢谢老牛,也感谢有这个机会跟大家介绍一下我们公司,我叫徐立,是Sense Time的CEO,上来也很我才发现我们好像有些不同,从上午来看大家都是好多人,谈话类的都是坐着的,咱俩是站着的,而且是两人,有点像说相声的感觉。我们公司的名字叫Sense Time,两个英文单词的组合。我们公司是一家技术公司,主要致力于用人工智能技术改变世界。说到改变世界的事情很多人是笑一下,我要说一段我们公司的故事。
先说Sense Time,Sense是感知,我们觉得人和世界的交互都是通过各种感知器获得信息,其中最大一部分感知来源是视觉感知,互联网上超过70%的内容是来自图像和内容,我们的注重点是在视觉感知,这是Sense词的含义。Time是时间,我们认为技术到了一个时刻,市场到了一个时刻,从这倒逼回来,这是Sense Time的来历。
牛奎光:中文名为什么叫商汤集团呢?
徐立:商汤属于Sense Time的音译,商朝是我们中国第一个有文字的时代,开创了从无到有的过程,商朝也是开启新篇章
的概念在里面,有种领先性,代表商汤SenseTime企业文化做中国原创的领先技术。
牛奎光:大家听的云里雾里,来点实在的。人工智能,人脸感知,这件事具体能干什么你能不能先给大家分享一下,或者是我们已经干了的。
徐立:人工智能的分支,主要强调的是视觉技术,我们到底在干什么呢?视觉无非就是用人脸看世界,看有两个重要任务:一个是看的清,一个是看得懂。所以我们现在主营业务在这两方面,一部分是帮助我们的机器,包括智能硬件、智能手机、智能机器人,各种设备看清世界。比如北京雾霾很严重,如果通过我们的硬件和算法看出去这个世界就是干净的。
牛奎光:你的意思是以后我们戴个眼镜就没有雾霾了。
徐立:对。
牛奎光:这是新生代技术的自欺欺人,用眼镜解决雾霾的问题。
徐立:这是前提,我们必须看清世界之后才能衍生出下一代智能。第二步是看懂看清,要明白这里边发生了什么事情,比较有意思的是传统的计算机视觉,前十年都在研究看得懂的问题,但是看得懂的问题这个范围太广了,我可能需要看懂这个东西是个猫,是个狗,是个书本,是各种各样的问题,没有办法把各个几个不同领域统一起来。目前我们公司想做的事情是一套统一的方法,使得看到的问题一并解决了。我们可以用统一的一套识别引擎,帮助人们看懂世界。
牛奎光:机器能够看得懂人在干什么,除了人脸之外还能看得懂。
徐立:对。
牛奎光:这个事挺厉害的,意思是说以后技术发展得好的话,在这放一台机器,就能看懂底下有多少人对我们说的事感兴趣,有多少人对我们说的事有点游离。
徐立:对,包括有多少人对我们说的有意见也会分析出来。
牛奎光:你这个厉害。在过去大概二十年里,从计算机的理解上,虽然有进步,但是都是小的进步,为什么我们到今天的时候突然就有这么多人工智能的应用,或者是叫突破,就出来了呢,是什么导致的这种变化?
徐立:这个问题非常好,这个领域发展了这么多年,都是看懂看清的问题,为什么现在是个机会?前段时间特斯拉的总裁他们抛出了一个理论,人工智能的恐慌论。他们认为未来一段时间人工智能会发展到一定程度,使人们产生恐慌。但是外界人看来这是非常遥远的空穴来风的事情,但其实这代表了人工智能自演进,我总结一下,它是一个阶段。以前的人工智能强调结果的智能,我要做一件事情,识别一个猫,看人的微笑,这是一个结果,各种方法达到这个结果来完成,在ToB的市场里面,一一击破比较难,但是最近几年有一种新的技术或者突破叫深度学习,它是一种利器,
中国有句话叫工欲善其事必先利其器,或者是磨刀不误砍柴工,深度学习带来新的突破,举一个例子,我们做的引擎,它可以解决各种问题,但我们不需要知道这个问题本身是什么。Google做了一个视频,没有人告诉它是猫。我们想说的是,我们这个团队在这个领域里面是第一个团队用深度学习解决视觉问题设。我们用核心技术做这把刀,把刀做好了,很多东西就可以一一解决。所以我们认为,这些人真实的恐慌是有道理的,现在的技术可以解决以前完全没有被定义的东西。
牛奎光:深度学习对很多人来讲就是一个词,我之前听过一个说法,跟你求证一下,深度学习更多是把计算机的算法模拟成人脑思考,如果这个说法成立的话岂不意味着以后计算机真的从智能上来讲越来越像人来思考吗?
徐立:这个说法很有意义,某种意义上是的。人工智能和人的PK当中有很多历史,最早深蓝就可以打败人,但是问题是那个时候的智能和我们现在说的人工智能不是一种,他是利用电脑的速度和存储,有限的步骤里面计算完了当然可以超越人类,这是传统意义上的超越。深度学习是制造一个脑子,他学的这个东西是没有一个人告诉他到底怎么做,他是从中自己总结出来规律,真的是和人类的思维方式一样。这才是大家恐慌的原因,到了一定阶段,机器的学习,或者说人工智能有突破了,而且我们正在临界点上,这个时候是人工智能的风潮。
牛奎光:你说了这么多能不能举一些实际的应用,我们实际用的有哪些事情?
徐立:我以我们目前的例子来举一下例子。刚才我们说的超越人类这样的智能略显遥远,目前来说,能够人工智能,或者说这类技术能改变人类生活的无外乎两大类:一类是对个人设影响;一类是对社会的影响。我们目前的业务可以分为好玩和好用,什么意思呢?智能影响了人,可以有娱乐性的东西。比如下面这台机器,这是一台测颜机器,如果一个人走到机器面前,它就可以自动识别出来我是谁,同时告诉我我的颜值是71,年龄34岁,略有不准,我的年龄35岁,老牛要不要跟我PK一下颜值。大家有兴趣的可以来测试一下,比如美图秀秀等都是我们的客户,把这个提供给他们,让他们把应用做的更好玩。再是使用,让我们每天用到它,改变用户的生活体验。有一个公司,我们合作的是人脸相册功能,当你打开相片,它会根据人脸不同分类,以后我要搜索自己的照片,点一下自己,它能够把我所有的照片分出来,如果我都是跟您一起拍照,或者有很多你的照片,又不想,一点你,就全都选出来了。这是好用的部分,欢迎大家一会儿来试一下。
牛奎光:尤其欢迎美女来试。
徐立:我们这个系统第一次出现是在京东奶茶馆,刘强东和张泽天都试了一下,说欢迎刘强东和张泽天女士来到京东奶茶馆。这是对个人的影响。其实对整个社会也有一定的变化,对人工智能也有深远的影响,一类是对公共安全产生影响,我们和东方网力的一份合资公司合作,可以做到自动人群分析,可以用相机自动分析出现场有多少人,这些人的走向,是静止的还是运动的。
牛奎光:摄像机就能直接看出来?
徐立:是的,通过这台摄像机就可以预警有没有人员踩踏事件等等。所以说我们想改变世界,关心国计民生。另外一类,人工智能是可以代替一部分的人力,提高效率,这也是改变社会状态的情况。比如我们做一些事情,银行开户,需要人做验证,看你这个人是不是本人,做身份证比对,需要大量人力,我们这套系统识别你是不是真的人,你如果拿手机拍张照片它会告诉你这不是真的人,大部分银行职员可以回家休息,但同时能够完成工作。
牛奎光:你说的太快了,什么意思?
徐立:也就是说有的情况下人们会拿照片去识别。
牛奎光:也就是说你可以做活体的检测。
徐立:对,非常对。我们可以调一下这个系统就可以演示什么是活体。目前我们公司主要业务有几大块,一方面是以手机互联网为主,通过我们的算法真正帮助他们的效率以及娱乐性的提升,另一方面是安防监控为主,现有的算法可以真正改变安防结构,做到升级。希望有这方面业务的公司都可以找我们来合作。
牛奎光:最后我也想听听你的看法,在说这个看法之前你最好稍微讲一下你个人的经历,人工智能在你看来,未来的两三年会有一些什么样的应用可能会冒出来,你刚才说的这些是已经在做的,跟大家分享一下。
徐立:我说一下我本人的情况。我本身是上海交通大学的本科硕士,我从那个时候就已经接触到人工智能,我曾经在摩托罗拉的实验室,包括联想智能研究院都待过,带过一些团队,之后我去了香港中文大学读的博士,所以我开始讲到我们为什么想改变这个世界,因为我们的核心团队有接近30%的人是拥有博士学位。
牛奎光:你们一共多少人?一共100多个人,大概有30多人是博士,大家可能觉得博士是比较远的事,或者说经济效益不是特别高,多年学成博士,自己做什么事不清楚。我曾经也问过团队的成员,简单为什么想做博士,他们得回答是,想用我们的技术做一些改变,这也是我们为什么把目标定成用原创的技术改变世界。
说到人工智能下一代产品,或者下一个几年的情况,我是这么认为的。现在像人脸识别,有一些特定物体等,已经到了成熟阶段。接下来需要做的是通用物体的识别,最近在这方面有一个世界级的比赛,参赛队伍有Google、微软、伯克利,这些世界巨头。百度也去了,百度之前有一个新闻,这个大赛叫大规模物体识别大赛,把所有物体找出来,通过翻查字典,其中发现有三千类物体,通过互联网把这三千类物体搜出来,基本上是大而全的物体库,他让这些人来做识别任务,难在什么地方引检测所有物体,我不告诉他我要检测什么,要先框出来,检测就是很难的事情,没有框的情况下又不知道怎么分类,所以是鸡和蛋的问题。目前我们的算法应该是在世界上排第一,Google排第二。
牛奎光:这样的话更要为我们大家介绍一下未来两三年,你认为能做到什么情况。
徐立:未来两三年我觉得在物体识别上会有一个突破,突破的意义在于某些垂直领域会成功人脸识别,比如汽车,包括智能机器人,机器人有眼睛,需要看,比如识别两个人的感情。我们希望从这个角度来说,从各个垂直领域物体识别有一个突破。二是更深层次的,物体背后隐藏的那层关系,它可以推断出来。
牛奎光:两三年以后可以做到机器识别物体,机器识别人与人之间的感情。
徐立:是。
牛奎光:厉害,感谢徐立,感谢Sense Time。