上市之门展现出重启的征兆,而抖音的现有业务却已经耗尽了想象力。幸运的是,迎面驶来的时代快车 ChatGPT上,装载的全是故事。
2月9日,有媒体爆料称,抖音旗下的人工智能实验室(AI Lab)正在开展类似ChatGPT和AIGC(人工智能生成内容)的研发,未来将为VR(虚拟现实)部门PICO提供技术支持。
PICO相关负责人随后回应称,相关传言不实,PICO目前没有采用类似ChatGPT技术的产品规划。
ChatGPT是一个由美国人工智能科技公司OpenAI推出的大型语言预训练模型,去年11月底上线。凭借看似无所不知、无所不能的AI聊天能力,ChatGPT短短三个月就吸引了超1亿活跃用户,也促使科技公司争先恐后扎身同一条赛道。
在美国,长期押注OpenAI的微软成为ChatGPT全球浪潮的*赢家,今年1月底宣布再向该公司投入100亿美元,并计划在Office、Bing等核心产品中植入相关功能;深感搜索引擎遭遇史诗级挑战的谷歌,也在2月初匆忙上线对标产品Bard。
国内科技公司中,BAT争相入局。百度2月7日宣布将推出类ChatGPT应用“文心一言”,预计3月完成内测、面向公众开放;腾讯宣称在ChatGPT和AIGC相关方向已有布局;阿里也放出达摩院版本ChatGPT正在内测的消息。次一级的中小玩家也不甘落后,京东、知乎、快手、小米、360等公司都和ChatGPT产生了或远或近的关联。
作为中国互联网的第三极,抖音2016年就设立了人工智能实验室,追赶这波ChatGPT的热浪顺理成章。同时,PICO是抖音元宇宙的探路急先锋,倘若将元宇宙和ChatGPT两大热点勾连起来,即便找不到应用场景,也有助于进一步打响品牌、提升销量。
但对于抖音而言,ChatGPT及其背后的通用人工智能的价值远不止于此。无论是为了中短期的上市,还是长期的互联网技术代际竞争,抖音都需要自己的ChatGPT。
抖音上市筹谋已久,但靴子迟迟未能落地。进入2023年,中概股及互联网行业转暖,尤其是蚂蚁集团基本完成整改,以及滴滴恢复上架和新用户注册,都给整个产业注入新期待。而抖音去年已经完成集团更名、CFO更换等多项关键动作,今年重启IPO恰逢其时。
但尴尬的是,抖音目前盘子很大,但要么是逐渐步入成熟期的老业务,比如抖音APP、今日头条等,要么是扶不起来的阿斗,比如教育、游戏等;集团发力点也集中在能够迅速带来现金流的业务上,比如货架电商和生活服务等。以抖音的底子,这些业务固然能够贡献收入,但都属于一眼望到头的生意,缺少超越时代的想象空间,难以让投资人感到兴奋。
倘若抖音趁着这波ChatGPT的*热度,拿出自己的通用人工智能路线图,哪怕暂时只是一张大饼,也极有可能在一级二级市场上掀起浪花,给不断下滑的公司估值带来提振。百度、知乎等公司股价飙升,已经验证了资本市场对于ChatGPT概念的追捧。
从长远来看,以ChatGPT为代表的AI技术,将是抖音完成技术底座升级的钥匙。
抖音一直借助中心化算法进行图文和视频内容分发,但如今算法的效率正在逼近极限,反映到业务上就是抖音、今日头条等主要产品增长放缓甚至停滞。再考虑到互联网新用户红利枯竭,抖音只有从底层做出改变,才能让内容池和用户池的联通更加精准高效,进而重启整个生态的增长引擎。
ChatGPT背后的AIGC恰好具备这种潜能。它借助人工智能完成了对存量非标准化信息的海量整合,并以自然语言聊天方式实现了更精细的个性化分发。这是抖音尚未涉足的信息分发路径,也是它需要在推荐算法之外增添的新引擎。
抖音从机器推荐向机器人推荐跃升,除了业务层面的价值外,也是在战略层面上抵御人工智能对于机器算法的降维打击。ChatGPT引领着的通用人工智能浪潮已经到来;而应对浪潮的*方式,就是成为它的一部分。
01
抖音很早就注意到了类似ChatGPT的技术风向,却起了个大早、赶了个晚集。
2019年7月,抖音人工智能实验室负责人李航在一场演讲中谈到,自然语言对话存在不错的发展机遇,从产品设计角度可以重点考虑四个机会,包括:任务驱动的对话机器人,信息类机器人,情感类机器人,以及游戏类机器人。其中,“任务驱动的对话机器人”的理想形态已经与今天的ChatGPT十分接近。
同一个月,大洋彼岸的OpenAI实现了公司化转型后的*个重大突破,拿到微软10亿美元投资,同时也借助微软Azure云计算平台打通了商业化路径。
可以说,在自然语言大模型研究方面,抖音AI技术人员颇有前瞻性,对其产品形态的预测也和日后发展相吻合。而在资金方面,抖音虽然不及微软,但也已经是中国互联网新贵,掏钱支持AI研究不在话下。
然而,与OpenAI可以心无旁骛地all in通用人工智能相比,抖音人工智能团队的KPI要繁杂得多,越来越多地趋向与业务部门打配合。这最终导致两者的成长曲线天差地别。
从公开信息来看,抖音对于AI技术在集团内部落地有着明确要求。它的人工智能实验室官网宣称,自己的研究重点是开发为字节内容平台服务的新技术;具体领域则包括自然语言处理、数据挖掘、计算机视觉、机器学习等,且和抖音各业务板块贴合紧密。
比如,在自然语言处理这块,网站列出了几个应用场景:Byte Translator,为字节跳动所有产品提供翻译服务;AI写稿机器人Xiaomingbot,涉猎体育、金融、时事的新闻写作机器人;以及头条和抖音的搜索服务。而在计算机视觉方面,抖音将AI技术运用在内容审核、短视频推荐系统、足球比赛理解和尬舞机等方面。
相比之下,OpenAI在诞生之初就把目标放在了通用人工智能上,也就是让机器能够像人一样思考、从事多种多样的活动。如果说抖音做AI是为了某一应用场景而研发技术,那么OpenAI恰恰相反,它首先试图让AI变得尽可能像人,至于能够做什么事,完全留给市场和公众去探索和检验。
其结果是,抖音AI部门虽然近几年成果不少,但整体集中在集团内部,尚不具备打破圈层的划时代技术力。而在许多时候,即便是抖音自己,对于自家AI能力的运用也并不算纯熟。
以自然语言处理为例,这是抖音AI团队的重点研究对象之一,而集团也在2017年前后试图扶持悟空问答,并连续两年投入10亿元补贴答主。但在这场并不成功的问答社区攻坚战中,抖音AI并未发挥显著功用,仅仅疑似在热点问题自动生成方面起了一点儿作用。
应用场景受限,又反过来拖累了技术实力的提升。根据市场研究公司statista的统计,2021年全球持有AI专利最多的7家公司中,腾讯、百度和IBM位居前三,而抖音并未上榜。
另一边,OpenAI一年一个台阶,与谷歌交替站在全球人工智能行业的顶峰。从2018年期,GPT(生成式预训练变换器)模型经过三次迭代,其中GPT-3模型在微调之后,成为如今的ChatGPT,几乎可以生成任何类型的文字,包括聊天、问答、论文、营销方案、诗歌、剧本甚至代码,拥有了近乎无穷无尽的应用可能。
在最新一轮融资中,OpenAI的估值达到290亿美元,约相当于1/10个抖音,且增长前景远未看到尽头。ChatGPT大火,或许会促使抖音重新审视自身的AI战略,并给AI团队更多时间和空间。
02 倘若抖音发力通用人工智能,集团内部的直接受益者当属今日头条。
今日头条发展至今,增长空间已经极为有限,负责人多次更迭。但它毕竟是整个抖音的龙兴之地,同时也是第二大活跃用户池,数亿MAU无法轻言放弃。
过去一两年间,抖音试图从供给侧激活今日头条,围绕创作者生态做文章,主要是提供更多的流量激励和现金补贴等。这类活动或许能够发挥局部效用,但无法真正改写今日头条增长基本停滞的大局。
根本问题在于,今日头条用户在被平台推荐算法“投喂”多年后,沉浸于信息茧房之中,越来越难以对那些超越认知和口味的内容产生兴趣。这种需求侧的活力下滑,很容易导致任何运营动作的效能大打折扣。
要想打破僵局,抖音必须在需求侧做出改变。它之前试图做问答、搜索等,都是希望让用户更加主动地获取信息,而非单纯等着平台上菜。但受限于各种短板,抖音的这些尝试并未取得显著成效。
如今,ChatGPT的爆红,让抖音看到了激活今日头条内容池、提升用户活跃度的新路径。
先看内容侧。自然语言大模型需要巨量文本数据进行训练:OpenAI的GPT-1的数据规模为4GB,GPT-2增至40GB,GPT-3膨胀至2TB。一般来说,数据多、质量越高,最终训练出来的模型的能力也就越强。
对抖音而言,这意味着今日头条沉淀十年的内容池突然有了广阔的应用前景。作为网络资讯,这些内容很多已经丧失了时效性,但由于不少内容具备较好的文本和信息价值,仍不失为大模型训练的养料,继续发挥余热。
再看用户侧。抖音擅长的算法推荐能够洞察用户喜好,却难以察觉人类获取结构化信息和系统知识的高层次需求,这也是它做不好问答的底层原因之一。
但ChatGPT开辟了一种新的信息获取范式:用户设计和提出问题,由AI整合梳理内容,并以用户期待的形态即时反馈。它提供的体验迥异于算法推荐、搜索和问答社区等旧工具,同时又在效率和准确度上有了显著提升。这种基于通用人工智能的个性化信息整合输出能力,是抖音提升图文用户活跃度的*秘钥。
更长远来看,ChatGPT这样的大模型除了应用在文本信息方面,也必然向图片、音频、视频等富媒体形态延展。抖音倘若做出自己的ChatGPT,受益者除了今日头条,也将是整个抖音阵营。
以“图文转视频”功能为例,知乎此前已经推出基于文本产出视频的功能,但效果差强人意;抖音也已经支持输入文字、搭配图片生成短视频,但AI在其中的运用并不多,成品质量主要取决于创作者自身。
人工智能有望改变这一现状。OpenAI此前发布了基于文本生成图像的模型DALL-E,国内的腾讯、百度等公司也上线了自己的AI绘图工具。抖音2022年发布了基于开源模型的AI绘画功能,累计近2800万人使用。对于通用人工智能而言,从生成文字到图片,再到视频,不过是一步之遥。
对于抖音集团而言,加码通用人工智能,即便暂时搞不出来ChatGPT同等量级的成果,也能带来资本市场所渴求的新故事,进而为上市增添筹码。毕竟,这一动作本身就表明,抖音并不是一家只专注于“去肥增瘦”的普通公司,仍然保有探索科技前沿的野心和能力。
03
不过,通用人工智能的研发需要耗费大量时间,每年的资金投入也以亿计。这对于花钱愈发谨慎的抖音而言,是一个不小的负担。
根据业内人士估算,目前大语言模型的单次训练硬件成本已经突破3000万元人民币,且仍在随着模型体量的放大而攀升。再加上其他成本,各大巨头需要准备百亿美元,才能最终决出胜负。
即便是有微软撑腰的OpenAI,也不得不在模型精度和成本之间做出平衡。它仅仅对GPT-3训练了一次;尽管AI模型存在错误,但OpenAI认为成本太高,没有再次训练模型。
作为一家中国公司,抖音还面临着先进芯片难以获取的问题。目前,英伟达是全球主流大预言模型开发者的主要芯片供应商,其客户包括微软、谷歌、Meta等。但受地缘政治因素影响,中国企业越来越难*时间买到*进的芯片,在模型训练等方面势必遭遇掣肘。
与百度、腾讯、阿里等公司一样,抖音想要做出与ChatGPT等量齐观的产品,可谓难上加难。但倘若能够杀出一条血路,其回报也将是巨大的。
对于抖音而言,一个拥有自主知识产权的自然语言大模型,除了能够给今日头条及其他板块带来飞跃外,还能向外输出AI底座能力,构建商业模式闭环。无论是内容创作、客户管理,还是代码编写、重复工作替代等,都可以发掘出大量应用场景。
以ChatGPT为例,除了充当免费的聊天机器人外,它还作为AI组件融入了微软Office等众多第三方产品,并通过API(应用程序接口)链接中小开发者,由后者探索出更多玩法。2月初,ChatGPT还上线了付费版本,用户可以支付20美元月费,从而在高峰时段访问聊天机器人。
母公司OpenAI已经从中获得不少收入。该公司预计,2023年营收将达到2亿美元,2024年将超过10亿美元。抖音倘若做出自己的ChatGPT,在前期的高投入之后,商业变现之路也会很快越走越宽。
不考虑财务因素,发展自己的通用人工智能,也是抖音避免沦为时代“恐龙”的必由之路。
ChatGPT横空出世后,整个科技行业都看到了AIGC的强大威力,互联网内容生态有可能被改写,直接感受到威胁的谷歌和百度马上官宣了类似产品。与两家公司相比,抖音已经完成从图文到视频的跃迁,ChatGPT至少目前威胁不到它,但并不意味着可以高枕无忧。
抖音的看家本领是推荐算法,它之所以击败了传统门户和视频网站,靠的是“机器取代人工”所带来的效率和体验提升。但推荐算法也面临着一个更加强大的对手——AI,后者以“机器人取代机器”,能够更准确地实时掌握用户需求和反馈,从而让信息分发更精准和高效。
就像当年算法推荐对于人工编辑的降维打击一样,通用人工智能相对于算法推荐也是另一个维度的存在。如今,它通过ChatGPT初露峥嵘,就已经显露出颠覆旧格局的巨大潜能。
对于握有互联网信息分发权的抖音而言,冲击浪潮虽尚未到来,但已经在路上。倘若无法避开来自下一个时代的冲击,那么*的应对方式,就是成为下一个时代的一部分。尽快上马自己的ChatGPT,或许是抖音2023年必须要做的事之一。