古话说的"人怕出名猪怕壮",现今恐怕有了续集——人怕出名猪怕壮,出名之后怕deepfake。
今年年初,受此困扰的是世界上被拍照次数最多的名人之一阿汤哥。
你能分辨出下图中哪个是真的阿汤哥吗?
答案揭晓:两者都不是。
左图是汤姆·克鲁斯的模仿者费尔希,右图是由Tiktok用户创造的deepfake版汤姆·克鲁斯。
这位名为Ume的用户创建的Deeptomcruise账号,只放了三条视频,便在一周时间吸引了38万的粉丝。这种效应,还只是deepfake视频野蛮生长的冰山一角。
在许多人仍然相信"Seeing is believing"的时候,历史的进程已经按下快进键:数据统计,2019年到2020年这一年,Deepfake视频数量增长了大概6820倍,从14678个视频增长到1亿个视频。
deepfake——这项曾负面缠身、让美国DARPA都为止头痛的"黑科技",已经大举入侵主流互联网平台,这究竟是好事还是坏事?
名声狼狈,被视为最严重的AI安全威胁
不得不说,当一项技术被冠以"deepfake"这个名字,给人的印象不负面都不行:fake已经是造假了,还要深度地造假。
但事实也确实如此,deepfake所代表的由深度学习 AI 系统生成的媒体内容,最早走红的用途非常负面。
2018 年,Motherboard 记者 Sam Cole在互联网上发现了一个令人不安秘密角落:一位名叫"deepfakes"的 Reddit 用户,借助AI将色情片中主角替换成名人,发布了不少未经同意的色情假视频。一年之后, deepfake应用程序越来越易于访问,即便那个论坛因为充斥着大量合成的色情视频而被关闭,与之相关的换脸色情片增长已经蔓延开来。
且deepfake名声扫地的功勋章,还不止色情片。
另一个臭名昭著的应用是用在政治目的。借助开源的人工智能算法,你只要收集一个人足够多的真实录像素材,就能操纵视频中的奥巴马、特朗普们,让他们"发表"任何观点,且达到以假乱真的效果。要知道,曾经只有好莱坞*工作室和情报机构才会制作这一类虚假音视频用于政治宣传。
图源:chameleonassociates
2017年~2020年期间,大量涌现的deepfake作品集中反映了该技术的阴暗面,用在名人伪造是这项技术滥用的重灾区。
充斥着社交媒体的换脸视频已经强烈动摇了人类长久以来对自己的视觉和听觉的信任。当消费的媒体内容真假难辨的时候,很容易出现被这种这些内容所欺骗的受害者。
图源:medium
Deepfake的巨大威力让很多人坐立不安,美国官员将它与核武器相提并论,媒体文章称其为"人类开启的一个前所未有的潘多拉魔盒"。有着"现实版神盾局"之称的美国国防部高级研究计划局(DARPA),近几年疯狂砸钱找寻鉴定deepfake作品的方法。《犯罪科学》于2020年发表的一份报告预测,在未来 15 年内,deepfake将成为众多人工智能技术中最严重的安全威胁。
但deepfake潜在的风险引发大众担忧,只是其中的一条故事线。
而在另一条故事线中,deepfake并非"洪水猛兽",甚至为许多行业打开了柳暗花明的局面。
图丨deepfake主打色情内容的1.0时代正在翻篇
新的内容生产方式,
deepfake象征着"AI创造力"
对于卢卡斯影片来说,有着《星球大战》系列这样一部经典永流传的作品固然是好事。
但一个现实问题摆在他们面前:这个系列有 40 多年历史,参演的演员有的已经去世,或者年事已高,继续开发《星球大战》系列可能需要启用新一代的年轻演员。鉴于大量角色已经深入人心的角色,这种改变恐怕很难赢得粉丝认同的。
卢卡斯影业采用的另一种方法是利用 CG 复原旧角色,如你所见,《侠盗一号》中塔金总督和莉亚公主就是用 CG 复原的。但最终效果并不是令人满意。
直到deepfake给了他们新的希望。
就在不久前,卢卡斯为自己的团队招了一位货真价实的网红。这位网名叫 Shamook的 YouTube 网红,尤其擅长制作deepfake视频。他在几个月前加入了卢卡斯影业旗下的工业光魔,将担任高级面部捕捉艺术师。
对于渴望新的内容技术的行业,deepfake似乎能大展拳脚。
deepfake背后的技术——GAN,是这几年在人工智能领域的热门方向,它代表着新的数据生产力,而内容本身就是一种数据。
GAN的原理类似左右手互博。它由两类网络组成,分别为生成器和鉴别器,前者负责在数据集上训练后生成虚假音视频,后者则负责对这些产物进行鉴别,直到再也检测不出真假为止。因此,对于GAN而言,生成器使用的数据集越大,作品的逼真程度越高。这一点也解释了为什么早期蹿红网络的deepfake作品多以名人为主。因此,也有人看到了这样一种未来:GAN代表着"AI创造力"的崛起。
不止卢卡斯影业,随着用于GAN算法变得越来越强大,创新者们及一众Deepfake 软件初创公司正争先恐后地寻找利用该技术"向善"的一面来改变行业的途径。色情和政治虚假宣传生成作为deepfake的杀手应用,该翻篇了。
游戏、影视、营销等行业正为后deepfake时代的到来摩拳擦掌。除了已经被许多人所熟知的各种换脸应用,以下是我们看到的几项和行业需求深度融合、颇具吸引力的deepfake新颖玩法:
1、声音滤镜
照片和视频的滤镜已经充斥着整个互联网,声音滤镜对我们来说却仍颇为新鲜。有不少初创公司正在加速这种新滤镜的普及。
创企Respeecher看上了合成声音的机会,只不过他们的声音作品主要面向的是影视业。当动画和电影制片厂不考虑使用真人配音演员时,Respeecher 的声音克隆就派上用场了。
一家更受瞩目的公司是Modulate。成立于 2018 年 Modulate团队有着MIT背景,曾因为在其网站上提供了美国前总统奥巴马正在"推销"该软件的deepfake demo走红,该 demo 展示的展示的逼真效果甚至一度引发恐慌。
现在,Modulate 正在游戏行业中使用 deepfake 来生成"声音滤镜"(也可称为"语音皮肤"),老派方法依赖于文本到语音技术,而 Modulate 的亮点是使用实时音频来合成语音皮肤。这家公司最近从 Hyperplane Venture Capital 和 2Enable Partners 等投资者筹集了 200 万美元。
公司创始人Mike Papps 认为,用户们会渴望在社交平台或者游戏平台上拥有一个很酷的音频化身,这将提供更好的互联网个性化体验。
"上网的消费者设计他们的在线角色。他们会为自己的角色花钱买新的皮肤,但一旦他们使用语音聊天……就打破了自己制造的幻觉,因为他们必须用自己的声音……得给他们这样的自由,能让他们完全进入自己的角色。"
不仅是体验上的完善,这样的一层语音皮肤让玩家隐瞒自己的年龄、性别、种族或可能导致被人骚扰的任何其他信息,也提高了语音聊天时的安全感。Modulate 想做的事情还不止如此。Mike Papps 表示,他们还有更远大的计划,那就是利用deepfake这样的机器学习技术针对语音聊天问题构建一套"全面的解决方案"。
2、高度定制、个性化的虚拟形象
我们几乎可以很肯定地说,未来电商、营销领域不仅仅有AI客服,也会有大量AI生成的"模特"。而且是对个性化要求更高的AI虚拟形象。已经有大量研究表明,拥有更个性化的消费体验会促成消费者的购买行为。
总部位于班加罗尔的Rephrase.ai 则使用deepfake技术,帮助品牌方大规模创建个性化的销售宣传视频。他们提供的工具允许企业自定义视频的各种元素,使用文本到语音的人工智能,以自然的方式用选定的语调讲述输入的文本,然后将其与预设人体模型的唇部动作和面部表情同步。
就像我们可以在文本、email中插入个性化的logo、图像一样,他们希望品牌方在视频内容上也能实现"信手拈来",无论这个视频是用于产品推广还是内部培训。
Rephrase.ai谈到这项技术时说:"与2015年前相比,人们消费的视频内容明显增多。但就生产和创作而言,它并没有太大变化。"直到deepfake的出现,"它将成为一种基本的接触方式。"
3、数据脱敏
看完上面的介绍,如果你觉得deepfake技术还是不够严肃,下面介绍的这个用法会改变你的想法。
我们知道,社交媒体公司的大量图像已经被 Clearview AI、ClearView 、HighQ 和 NTechLabs 等公司抓取,我们的大部分个人信息已经在网上流传。
在全球范围内愈演愈烈的人脸隐私担忧浪潮中,D-ID 没有被吓倒。这家公司想做的事情非常简单,就是利用deepfake让人脸数据变得不可追溯,但不抹去年龄、性别或情感等重要属性,仍保有其某些数据价值,这种智能匿名功能为生物识别数据库提供了新的安全性。
图源:springboard blog
D-ID由以色列军队网络安全和进攻性网络部门的成员。D-ID 判断,归功于欧洲和美国某些州的新隐私立法,deepfake用作匿名技术的需求将继续扩大。目前,AXA Ventures、Pitango、Y Combinator、AI Alliance、现代、欧姆龙、Maverick(美国)和 Mindset 等都参与了D-ID此前的 1350 万美元融资。
更让人兴奋的是,D-ID 收到了汽车制造商的需求。汽车正在变成一款电子消费品,大量的汽车厂商、自动驾驶软件厂商们希望有新技术来实现驾驶监控系统的匿名,既能收集驾驶员的反应,但不能记录任何公共识别信息。
监控行业则是另一个潜在客户。一些监控主要负责记录物理空间,而不需要收集进出建筑物的人的识别信息。
"加强监控和个人隐私保护的融合,使企业处于必须对其存储的图像进行匿名处理,否则就将面临违反隐私法并付出高昂代价的风险。"
图丨deepfake生成的婴幼儿马斯克
从上述这些应用我们也不难看出,deepfake固然有其风险所在,但人类同样可以像使用其他技术造福自身一样挖掘这种工具的潜力。
图源:springboard blog
"这就像 20 年前的 Photoshop,人们不知道什么是照片编辑,现在他们知道了照片也有赝品,"创造了阿汤哥deepfake的Ume 也说,自己并不太担心deepfake的未来。
deepfakes将继续存在,精灵已经不能再放回瓶子里了,人类需要自己找到和它相处的方式。
随着deepfake与我们真实世界的互动越来越多,人们对它的期望将会改变,就像经历 Photoshop 诞生对图像的改变一样。
21318起
融资事件
4459.49亿元
融资总金额
11701家
企业
3222家
涉及机构
516起
上市事件
5.95万亿元
A股总市值