当被称为“AI下一代风口”的AIGC时代启幕,ChatGPT激起的大模型浪潮也涌入中国后,原本深耕于AI赛道中的独角兽们,被认为是红利当头、最应顺势而为的那个。
然而,要与一众科技巨头展开大模型竞速,靠计算机视觉算法能力占领AI领域的“四小龙”——旷视科技、商汤科技、依图科技和云从科技,在本就分化的发展路径上,各有不同的故事在发生。
过去的两个月里,商汤科技、云从科技分别面市了“日日新SenseNova”大模型体系和“从容”大模型,反观旷视科技与依图科技,则被质疑“难产”。
被记者问及大模型的创新推进情况时,5月25日,旷视科技方面援引CEO印奇的话作出回应,“在过去四五年时间,我们对大模型这件事情一直非常深度follow的。”
印奇认为,大模型方向是确定的,旷视也会对其中的技术能力进行坚定投入,但“我们不会去赶这个热点”。
同样的疑问抛给依图科技,尽管其创始管理团队未予以答复,但内部一副总裁向记者透露,“作为AI公司,依图很早就在关注Transformer和做相关方面的研究工作。”不过业务侧进展如何,其表示目前没有可以对外公布的讯息。
谈及上述两家公司的“低调”,来自云从科技的一位管理中层有种个人理解,“我们和商汤比较幸运,在最困难的时候,登陆了二级市场,不然现在肯定也很难。”
做大模型,烧钱
上述管理中层人士以云从科技为例指出,在投入基础训练模型的同时,还要做行业模型,“行业模型天然就是需要算力的。”他觉得云从敢这样做,底气在于有资本的原始积累。
云从科技在其2022年年报中披露,过去一年因筹资活动产生的现金流入达29.4亿元,其中59%为其当年上市融资所得。
需要注意的是,大模型不但开发成本高,其因需求高算力,训练成本也不容小觑。之于云从科技,想要跨过算力这道门槛,其董事长兼总经理周曦的理解是,投入得到位,于是,重视研发投入的云从科技,决定“一定要投一二十个亿来做这件事”。
如何衡量云从科技面向大模型的这笔投入,一组数据显示,2019年-2022年的四年间,云从科技在研发侧的费用支出总计也就21亿元。
舍得投入的同时,云从科技不是没有资金压力。“现在买卡很紧张,买不到,就相当于无米之炊了。”上述管理中层人士给记者算了一笔账,做一个ChatGPT大约需要耗费3万张显卡,参考英伟达最新的GPU芯片H100,“一张卡动辄数十万人民币”,一个大模型仅在算力这一基础投入上,至少花费几亿元人民币。
据他透露,云从科技虽然储备有几万张显卡,但目前能用来做大模型训练的却很缺乏。一个更为严峻的现实,当下英伟达H100、A100、A800等几款GPU芯片,都出现了全球断货现象,包括云从科技在内的正在进行大模型训练及优化升级的企业,都在寻找算力卡的替代和解决方案。
竞争之下,云从科技抛出了定向增资计划。距离“从容”大模型面市也就一个半月前,云从科技公告称,欲为“行业精灵”大模型研发项目,募集资金不超过36.35亿元。
由于云从科技去年5月27日才登陆科创板,上市未满一年便进行如此大规模募资,也引发监管机构疑虑。在“从容”大模型发布前两天,云从科技披露公告称,收到上交所下发的《关于云从科技向特定对象发行股票申请文件的审核问询函》。
这一消息发出当天,5月16日,云从科技的股价低开走低,盘中一度逼近跌停。整整十天之后,截至记者发稿前,上述云从科技管理中层人士表示,定增计划的审核结果“应该还有一段时间(才能公布)”,他希望这笔钱能让团队,“多采购一些不同的算力卡,以备模型的迭代升级和优化。”
商业化故事,难讲
其实,在推出“日日新”大模型体系时,商汤科技联合创始人、大装置事业群副总裁陈宇恒就当场纠正了一个误区:不是“买了很多GPU,就可以去搭建超大规模的训练集群。”
不过,记者看到,彼时的商汤对外展示出了自己的“雄厚实力”:历时五年建设的大装置上,总共有27000块的GPU芯片卡,是亚洲目前*的智能计算平台之一。
“秀肌肉”的同时,商汤科技董事长兼CEO徐立还不忘对外释放AI大模型的商业化前景,“商汤并不需要再额外投入太多,甚至已经开始通过大模型获得收入。”
不过,讲好大模型的故事,并没有那么容易。
尽管商汤科技的2022年度财报,首次实现了五年以来的亏损收窄,其研发支出也同比实现双位数增幅,但因其大模型发布当天,对“秒画”平台的操作演示环节涉嫌“抄袭”AI模型站Civitai上的图片,瞬时,商汤科技“匆忙”闯关被热议,其大模型的实际效果更被质疑与业界预期不符。
商汤科技、云从科技等以视觉算法技术见长的企业,虽是AI 1.0时代的宠儿,但在《ChatGPT:读懂人工智能新纪元》一书作者、前沿科技领域观察分析人士陈根看来,迈向AI 2.0时代,尤其大模型浪潮涌起,上述企业在自然语言模型相关的技术储备和路径上都欠缺。
“发布大模型,只是为了迎合技术概念热潮。”陈根直指商汤科技当下的现实境遇,初始投资者没有实现良好的收益,“它正面临投资人退出的压力,要么通过改善公司盈利能力来促进股价,要么就是抓住资本热点来促进股价。”
显然,从商汤科技的经营层面来看,扭亏虽然有趋势,但转向盈利“基本看不到希望”,陈根对于AI企业借助概念热点“讲故事”的方式,不置可否。即便旷视科技、依图科技当前没有对外实际公布,他也不觉得这些企业在大模型上存在“难产”。
“本身就是个技术故事,只是这个故事还一直在研发中心研发。”陈根说。
在接受媒体采访时,印奇有这样一句话令人印象深刻,“我们不会做纯对话的事情。”他对ChatGPT进行解构后,发现对话应用背后的大模型,包含知识引擎和逻辑引擎两部分,而印奇对旷视科技在逻辑引擎方面的能力予以肯定,他透露,旷视科技专门成立了一个叫“Foundation Model”的小组,“只做核心的模型设计,不做工程化的事。”
印奇认为,在当下大模型已经形成“大一统”的局面,多模态发展共识下,核心看谁在深度学习的模型领域有更深的理解和更强的模型设计功底。
新风口下,蓄势
旷视研究院主任研究员张祥雨,目前就担任“Foundation Model”小组的负责人,他自ChatGPT发布以来,基本上每天都在使用,除了摸索这个智能机器人拥有的知识储备,“我更关注它的逻辑推理能力。”
在张祥雨看来,目前包括ChatGPT在内的大模型技术应用,其实背后的逻辑是,在一个AI模型里,不断增加数据和模型大小,来实现性能的持续提升,这与规模化效应有关。当旷视科技也进入其中摸索,面临的挑战是,视觉与自然语言的差异。
身在旷视科技,张祥雨正在思考,如何把视觉模型中的数据有效利用起来,再设计相关的无监督、自监督的方法,让模型能在其中进行深度的理解学习。
“我更希望看到创业公司一边赚钱、一边赚数据,一边赚知识。”蓝驰创投管理合伙人朱天宇觉得,企业迈向AGI时代,除了大模型应用,还要考虑切入的场景中,能否持续获得新数据,数据能否反哺AI模型的训练,从而让场景中的智能化服务的质量效率更高。
不难想象,这是一个可以循环起来的闭环。微观AI四小龙,除了旷视科技、依图科技仍被资本市场拒之门外,每家公司都凭借各自的技术特点,在智慧城市、安防、物流、医疗等垂直领域形成了一定的优势壁垒。
陈根对依图科技有所关注,这家AI公司在人工智能医疗领域的优势,完全有机会基于医疗这一垂直领域“打造一个GPT医生”。这样的例子不胜枚举,再比如商汤科技,在智慧城市治理方面,也有独特的数据与技术优势……陈根呼吁外界,在通用大模型技术应用外,更多关注AI四小龙“是否能打造出更多垂直领域应用的专业化GPT”。
朱天宇则强调,不能迷信大模型,反倒要非常重视大数据,“人工智能还是源于大数据蓬勃发展,没有数据,人工智能也是无米之炊。”来自云从科技的管理中层也有共识,“闭门造车”式训练AI模型,没有来自千行百业的数据,根本训练不出来一个真正智能化的大模型。
“没有深入这个行业,你连数据长什么样,业务怎么样,都不了解。”目前,这位云从科技管理中层就专注于借助“从容”大模型,深入不同行业进行优化测试,从而研发出专属于某垂直领域的行业大模型。
当然,行业落地需分阶段,上述云从管理中层看到,一些厂商号称“敢去做行业模型”,但从现实看,其推出的基础大模型多停留在互联网产业,“卡就那么几万张,训练万亿数据规模的大模型,卡都占了一大半,哪有资源来训练行业模型?”
采访的最后,上述企业管理中层透露,目前云从科技的算力卡资源,倾向于行业模型训练,“基础模型训练的算力芯片,最多不能超过1/3。”