内容审核是字节跳动绕不过去的一座大山。抖音在国内所面临的压力,TikTok在海外也没能幸免。
印度一位TikTok创作者上传了一段向女性泼酸性液体的视频,再次引发对于TikTok的广泛争议。大量印度用户表示将抵制TikTok,并在Google Play商店中对TikTok给了1星级评价,导致TikTok的评分一度从4.5星陡降至1.2星。
TikTok正高歌猛进海外市场,印度正是下载量*的市场,迄今为止贡献了6.11亿次下载,占TikTok全球总下载量的30.3%。
字节跳动的出海梦想已照进现实,内容问题使TikTok深陷舆论漩涡,提升内容审核的精准度和速度,能为Tiktok的全球化进程减少一些阻力。
绕不开的人工审核
TikTok所面临的内容审核难题,是全球互联网公司共同心病。
亿欧智库研究院院长由天宇表示,在全球范围内,随着内容的数字化程度越来越高,数量越来越庞大,内容类型的复杂度不断增强,需要构建与之相匹配的内容管理机制。
近几年,Google、Facebook、Twitter都显著加强了内容审核的力度,激增的内容包括文字、图片、视频和音乐,审核技术正经受着新一轮的考验。
国内市场内容审核团队已成为大型互联网公司的标配。
以短视频业务为例,2019年1月出台的《网络短视频平台管理规范》显示,网络平台开展短视频服务,应当根据其业务规模,同步建立审核员队伍。审核员数量与上传和播出的短视频条数应当相匹配。原则上,审核员人数应当在本平台每天新增播出短视频条数的千分之一以上。
字节跳动为此早已组建了规模庞大的审核团队,同时也在研发人工智能审核技术。
2018年,字节跳动副总裁张辅评曾表示,字节跳动确保对所有推荐内容进行人工审核,字节跳动审核团队人员已超过1万人,其中大部分从事视频审核。
同一年,字节跳动副总裁、字节跳动人工智能实验室主任马维英透露,抖音一直使用人工智能辅助审核,构成人机交互的闭环:平台上有 600 多个机器学习模型,能够自动理解和识别内容;审核人员同时也是标注人员,用标注好的数据训练模型,再反过来帮助审核。
通过自主研发的AI技术,字节跳动节省超过十万的审核人力,人工审核团队却仍被保留。究其原因,除了管理规范的要求硬性要求外,AI审核的技术瓶颈也是原因之一。
AI审核的技术瓶颈
人工智能的局限性在于,不能对所有的媒介形式进行精准识别。
对于图片和视频来说,人工智能介入审核非常有效,因为计算机视觉识别技术相对成熟。机器通过一定时间的训练,都能够识别出敏感类别的内容,比如裸体、枪支等。
在对语音、文字进行分析时,不能达到识别图片和视频的高准确率。不同的文字在不同的语境下,表达的含义可能有所不同,人工智能很难像人一样思考,理解语言的真正含义。背景音和噪音会对识别造成干扰,在方言识别上,AI也略显吃力。
图普科技创始人兼CEO李明强坦言,内容审核目前*的障碍是语音,国内市场面临方言识别难题,出海企业要针对当地语言配置小语种识别,技术难度大于方言。
在由天宇看来,语音审核在研发阶段需要投入较高的成本,语音内容的精准识别难度较大,语义的复杂性也带来了诸多挑战。
与人类能够对新事物进行思考不同,深度学习技术只能根据既有的数据进行训练,对新出现的不良内容,人工审核进行甄别,对用户行为进行判断,在此基础上,才能总结经验“传授”给AI。
如果AI审核出现问题,平台也需要承担法律风险。
中国政法大学传播法研究中心副主任朱巍表示,AI审核是基于深度学习的人工智能,其中的程序、算法,实际上体现的是一个平台的价值观和法治观。“不管这个技术是由平台自主研发,还是由第三方提供,一旦出现问题的话,平台肯定要承担责任。”
从安全和成本两个方面来考虑,通过AI审核进行初筛,再将疑似有害内容送达人工审核二次判断,依然是内容平台普遍采用的审核模式。
自研技术并非标配
涉足UGC内容的平台日益增多,用户上传的内容作品质量参差不齐,内容审核方面的需求也随之不断增长。引入AI审核工具成为内容平台的必由之路,至于选择自主研发审核工具,还是与服务商合作,要看平台自身的考量。
亿欧从业内人士了解到,字节跳动并未引入外部内容审核工具,可能是出于数据保护的需要。腾讯、阿里、百度等头部互联网企业在内容审核方面都有所布局,如果选择与外部机构合作,可能有将平台内容和数据泄露给竞争对手的风险。
AI审核工具需要大量数据进行训练,字节跳动旗下拥有多个内容平台,能够建立较为完备的数据库,工具研发后可以高频应用。字节跳动对于内容审核工作十分重视,选择自主研发可能更适合自身发展需求。
哪些企业会选择第三方提供的AI审核服务呢?根据李明强的经验,与头部企业相比,腰部企业更愿意引进内容审核领域的合作伙伴,将资源和精力放在最核心的创新业务上,很少采取自主研发的方式。
AI审核公司相对市场更具审核优势,李明强表示,某一平台不良样本的种类和数量都比较有限,服务商介入能够起到众包和共享的作用。不良内容在一个平台上出现,可以快速被收入数据库中,在服务其他公司时更加便捷、安全。
中娱智库创始人高东旭认可了这一观点,创业型内容平台资金和技术实力有限,只能通过第三方的工具和平台来进行内容监管。目前国内的数美科技、图普科技、百度智能云、金山云和阿里云等,都能提供相关的服务和工具。
平台若想从源头减少内容风险,除了引入第三方机构进行内容审核外,提升团队的把控能力也十分重要。“在内容生产前,可以请行业专家对内容生产者进行培训,在内容创作阶段就能规避一些风险,同时,还应该加强对于法律法规和相关政策的了解。”高东旭说道。
出海平台如何过审核关
内容平台出海,并不是字节跳动独有的战略。
今年5月初,快手在美国发布了应用Zynn,允许用户上传、编辑和分享短视频。据Sensor Tower提供的数据,在Zynn发布的一个月后,就成为了美国下载量最高的iOS应用。
欢聚时代旗下的泛娱乐直播平台BIGO LIVE也在海外取得了不俗成绩。2020年*季度,欢聚时代的全球平均移动端月活跃用户达到5.2亿,其中77.0%来自海外市场。
作为行业观察者,由天宇站在时间沿革的角度,回顾了互联网企业的出海历程。在互联网领域,中国公司最早的出海产品主要为工具和游戏,认知属性和内容色彩较弱,以B2C模式为主。此后,资讯类产品又成为了出海的热点,内容多以PGC的形式生产,内容审核方面的压力仍不算太大。
国内娱乐平台、社交平台陆续出海,带来了UGC内容的激增,对平台内容审核能力的要求越来越高,十分考验平台内容和当地文化的兼容程度,以及平台运营商的文化理解能力、沟通协调能力和问题解决逻辑。
AI审核技术的第三方服务也跟随平台走向海外市场。“图普针对海外市场研发的图像审核产品,已经在全球多个地区部署了计算节点,其中海外市场应用最广泛的是暴力、色情、未成年识别等审核场景。”李明强说道。
AI审核的技术瓶颈也在出海过程中体现。东南亚、印度、非洲是中国互联网平台出海的主要方向,这些国家和地区都具有语种多样的特点,AI技术则只能在图像、视频审核上沿用国内数据,势必有所局限。
TikTok在印度市场遇阻正是例证。拥有13亿人口的印度拥有巨大的市场空间,对内容提供商的挑战是复杂的语言体系、多样的宗教和文化背景,甚至还有当地尖锐的社会议题。
2019年2月,TikTok就曾因内容问题被印度政府封禁。作为应对,字节跳动在印度沿用了AI技术与审核团队协作的内容审核流程,审核团队可以支持14种语言,并用本地语言做出与文化相关的决定。
字节跳动计划在2019年12月之前将印度分公司员工人数增加到1000人。此外,字节跳动还在印度雇佣了超过250名的专职内容审核员。
越来越多的互联网平台尝试到海外发展,做好前期准备工作,可以避免内容违规后的被动整改。
作为法律从业者,朱巍为出海平台归纳了避免违规的要点。首先是对儿童权益的保护,杜绝儿童色情等内容的出现,否则在各个国家都将面临顶格处罚。
做好用户的个人信息保护也至关重要,在美国、欧盟、新加坡等地,适用的个人信息保护规则可能都不相同,在抓取信息、推荐信息时需要注意当地法规。除此之外,还要遵守当地的文化和风俗。
高东旭则给出了进一步的建议:在出海前,互联网企业必须先行制定适用于海外市场的审核机制,避免平台内容出现问题。“出海平台可以在当地聘请法务人员、熟悉当地文化和宗教的人士,建立配套的审核机制。”
尾声
媒介形式的进一步多样化,正给内容审核带来新的挑战。
新兴的数字娱乐产业是高东旭关注的对象,根据他的观察,AR、VR的技术门槛正在降低,大量应用AR、VR技术的内容也在不断涌现,对于如何进行这一部分内容的监管,仍待企业和相关部门关注和进一步研究。
知识付费催化了语音内容的发展,喜马拉雅FM、荔枝FM、得到等平台的音频内容数量激增,质量参差不齐,针对语音内容的监管力度也在加强。
李明强十分看好内容审核产品的未来:“随着5G和融媒体的发展,平台的内容量将会呈几何级数增长。内容审核技术是一个底层服务,市场需求会持续变大。”
10735起
融资事件
1376.66亿元
融资总金额
6512家
企业
1887家
涉及机构
185起
上市事件
1.18万亿元
A股总市值