无论是巨头,还是有点规模的企业,都在做行业大模型,未来几个月将迎来密集发布期。但不得不正视的一个现实时,大多其实都还停留在讲概念、讲技术、进行内部测试或项目定制的阶段。
本周,一位互联网人士分享了一个小故事——几天前,他曾遇见一帮创业青年,在交流的过程中,对方告诉他,他们搜集了一大堆修车相关的案例和知识,想问问他能不能提供通用大模型的能力基础,来帮助他们去训练一个修车行业的大模型出来,以便让中国1000万修车工都能拥有20年老师傅的功力。
“这是一个典型的行业的能力。”在他看来,今天有太多垂直领域,其实是ChatGPT等通用大模型解决不了的,例如面对修车问题,他们都只能泛泛而谈,“未来大模型这个产业怎么发展,我觉得还得往垂直化、产业化、企业化,甚至个人化发展”。
实际上,相关企业都已摩拳擦掌。互联网大厂百度、阿里纷纷官宣伙伴计划和工具链,声称要让每一个行业都能够用上自己的大模型。各行各业的龙头企业、创业公司,同样马力十足。金融、教育、医疗、自动驾驶、智能物流、安防等多个领域的行业公司都已相继传出要推行业大模型的消息。
“全国都在大炼行业大模型”, “现在只要是上市公司或规模稍微大一点的企业,他们都会有。”相关推出行业大模型的企业的多位员工告诉数智前线。“预计几个月后,行业大模型将会迎来一波密集发布的小高潮。”多位业界人士称。
大模型的战事,已经开始从通用大模型,迅速卷向面向垂直领域的行业大模型。
01 行业大模型卷起来了
“现在我们去跟客户谈,很多客户也不太了解什么是行业大模型,但是一上来就说,我需要你们的行业大模型。”百度智能云AI平台副总经理李景秋告诉数智前线。
她最近和很多企业进行过沟通,发现一般会存在两种情况,一种需要的是SFT(有监督精调)的大模型,只需基于工具链去标注几百到几千或者上万条数据,就已经能达到企业需要的效果。但还有一种,一定需要构建行业的预训练模型才能解决,也即打造一个行业大模型。
李景秋发现,尤其是教育、金融、能源方向,很多有行业数据和场景积累的龙头企业都希望和大厂合作,构建行业大模型,并进一步孵化行业应用,广泛去服务上下游相关企业。
行业大模型的重大意义在于,通用大模型虽然具备涌现的能力,但如果原始数据里一点行业数据都没有,那它对行业理解还是会存在局限性,而一旦存在知识上的局限性,行业大模型一定会有需求。“而且国内的数据生态没有那么开放,每个企业都有大量沉默的行业数据,这些数据的价值,要通过行业大模型才能激活并发挥出来。”李景秋解释称。
中科深智CTO宋健认为,不管是从一些行业对专业知识的要求,还是从安全性、成本和效率问题来看,行业大模型都是必然存在的。“尤其对我们数字人领域来讲,实时性非常关键,用户问的问题它要在一秒以内能回答,这个是通用大模型达不到的。”
但生成式AI大模型的确为数字人这个行业带来了巨大的想象空间。宋健透露,之前,一套好用或者可以达标的数字人后端对话系统,对他们来说一直是道难题,数字人一般只能做到有一套简单的问答系统,很难满足用户需求。例如在电商直播间,用户能问的问题和问法基本是被限制的,一旦说法发生变化,后端的问答系统可能就无法匹配。但大模型强大的语义理解能力为这个问题提供了解决方案,让用户可以从“和一个很傻的白痴在聊天”,进化到“可能跟一个比较聪明的正常人在聊天”。
“这个区别是非常大的。”宋健告诉数智前线,这也是他们为什么从3月份开始做相关准备,并在5月正式推出面向虚拟人这一垂直领域的行业大模型——数智姜尚的原因。中科深智是国内一家虚拟人公司,有数据显示,其虚拟主播产品已服务超2000家客户,占据主流电商平台虚拟主播近70%的份额。
无独有偶,大量的行业企业也已经开始行动。
今年6月初举行的2023国际通信展上,中国移动在展台上,展出了他们的“九天”行业大模型在网络运维领域的应用。现场工作人员演示,在有多个线头交错的一台电信设备中,行业大模型可以识别几百个插线接口的情况,从而让运维人员可快速进行光纤线缆的接插。同时,中国移动也正在研发和内测的一个客服的行业模型,未来可能会对外提供,带头人是中国移动首席科学家冯俊兰。后者自2013年9月加入移动以来,就创建并带领了中国移动人工智能团队 “九天”,至今已近10年。
而在此前的5月29日,中国联通研究院副院长、首席科学家唐雄燕也曾向外透露,中国联通正在打造一个通用的、可适用于各网络体系的通信大模型。中国电信更是早在4月底召开的2023云生态大会上就表示,天翼云正在自研预训练大模型,并已进入内部测试阶段,将在近期适当时候面向市场发布。
安防行业的企业们同样动作频频。前不久的2023安博会上,AI大模型的身影堪称“扎堆涌现”。据不完全统计,现场至少有包括商汤科技、宇视科技、360智慧生活、熵基科技、联汇科技、算能等在内的6家不同赛道的头部企业,都展示了自己的通用或行业大模型,及相关的应用Demo。
安防行业“海大宇”三巨头中的宇视科技在5月推了宇视AIoT行业大模型“梧桐”,并在此次安博会上展示了该行业大模型在Vlog等场景的应用。它可将景区专业设备抓拍的游客游览视频,自动生成vlog,配上文字和表情包。
多模态生物识别企业熵基科技设了一个自研大模型及技术专区,专门展示自己涵盖了140亿、70亿、13亿等多个参数规模版本在内的BioCV大模型矩阵;人工智能企业联汇科技也用了大量笔墨介绍自己百亿级参数的视觉语言大模型OmModel,并表示下半年还会有一个V3(OmModel V3 )版本的发布;算力提供商算能则专门用了一个位置,来展示其与算法合作伙伴千视通合作推出的AI大模型训推一体机,并将应用场景定位在了智慧网点、智慧职场、智慧巡检、风控监督。
而在金融领域,包括中国农业银行、江苏银行、度小满、奇富科技等都宣布推出了行业大模型。教育领域传出过要推行业大模型的也不在少数,包括网易有道、学而思、淘云科技、孩子王等。6月11日,中公教育也宣布要与新华网联合推出全三维数智人及职业教育行业大模型。
自动驾驶、医疗、房产经纪、智能物联等多个领域也相继有行业大模型涌出。4月,毫末智行宣布发布全球*自动驾驶生成式大模型DriveGPT;5月,我爱我家宣布联合第四范式推出行业*房产经纪大模型1.0版本,深信服也将自己自研的安全GPT大模型进行了首秀;同月底,互联网医疗公司医联发布自研的医疗大语言模型MedGPT……
一场行业大模型热潮正在快速到来。
02 用开源还是自研?
当市场在短短几个月内,迅速涌现出大量通用大模型和行业大模型时,一些变化也在悄然发生。
"GPT的API调用成本在3月份之后下降到了1/10,更重要的是,开源业界在过去几个月里变得特别繁荣。”云蝠智能创始人魏佳星告诉数智前线,大量开源大模型的出现,让他们在打造面向智能客服领域的行业大模型时有了几种不同的路径选择方案——要么自研,要么基于开源大模型进行微调,又或是采用闭源但接口价格不贵的大模型。
在对比了市场上的各类开源和闭源大模型的使用效果及成本后,云蝠智能最终采用了“自研小模型+开源大模型+垂直语料”的路径,于近期上线了10亿参数的NLP神鹤大模型,可支持问法自动扩写,大幅提高智能客服回复逻辑的完善度。其中,自研小模型主要负责核心的匹配逻辑,清华系公司智谱AI的ChatGLM-6B开源大模型则用于支撑小模型完成不了的边缘部分工作,例如对问题相似度算法进行支撑。
也有不少公司选择“几条腿一起走路”。
“百度文心一言,以及其他的一些模型,我们也都在用,只是用的地方不太一样。”中科深智CTO宋健告诉数智前线,在一些实时性、专业性以及数据安全性等要求较高的场景,例如虚拟助播,他们一般会用上自己自研行业大模型,但在一些通用场景,也会用到文心一言或其他大模型。
“这并不矛盾,这些大的互联网公司的千亿级通用大模型还是有它的优势的,我们并不会把所有的需求都在我们自己的模型上去满足。”宋健说。在他看来,在这个各种商业模型刚推出不久,尚未十分成熟的阶段,很多企业都会去考虑“还有没有其他选择”。
熵基科技的一位人士也告诉数智前线,他们目前的行业大模型打造路径,既有自研的,也会基于开源大模型进行微调,二者“互相借鉴”。
值得一提的是,多位业内人士均认为,在当下的情况下,出于对成本、进入门槛和速度等的考虑,开源大概率会成为接下来一个非常关键的领域。一方面,从事大模型开源的可能会越来越多;另一方面,在开源大模型的基础上去调试自己的东西,也会成为一个主流。
“我觉得90%以上的在未来都会用开源模型。”一位业内资深人士表示,这就像当初的Web服务器、数据库等互联网基础设施,最后在市场上留下来的,除了少量私有,其余绝大部分场景用的都是开源的。
“但就现阶段而言,你也不能对某个大模型依赖过重,毕竟战局还没有最后确认下来。”魏佳星强调,这就好比10年前安卓、塞班、黑莓等一堆底层操作系统厂商在干架,一旦某家企业对某个操作系统过于依赖,后期它的方案又长期跟不上迭代,这家企业就会吃亏。
在他看来,基于开源大模型做行业大模型的企业,在尽可能跟市场上这些开源大模型结合的同时,又要解耦。他举例称,云蝠智能的行业大模型虽然与GLM是对接的,但都是用的提示词的形式来对接,耦合度很低的,“我随便换一个模型,一下就能换掉”。
上述熵基科技的人士也透露,他们自研的大模型参数目前会相对小一点,但其会将基于开源大模型微调的模型作为老师或参照物,在对比学习中持续进步,避免对开源大模型形成过度依赖,且最终落到产品里面的,都会是他们的自研大模型。
在终局到来之前,行业大模型市场的玩家们都需要在谨慎中前行。
03 故事刚刚开始
搞行业大模型的玩家一个接着一个,但就目前来看,大多其实都还停留在讲概念、讲技术、进行内部测试或项目定制的阶段。
上述熵基科技的人士告诉数智前线,他们目前在探索落地上都还是项目制的,比如他们正和一家医院一起,用自研大模型,做一个导诊台的问询机器人,但现在具体的成熟产品还没有,“还在测”。而在2023安博会上,数智前线发现,现场强调了自己的大模型能力的企业,也大多只展示了他们的大模型技术或相关应用场景的Demo。
一位互联网大厂资深人士也透露,他们目前基本上都还在项目定制阶段,着重在提炼需求,积累数据。
百度智能云AI平台副总经理李景秋则表示,现在来找到他们做行业大模型的,都是行业内的龙头,百度虽然在19年就和浦发银行、国家电网一起推出了金融、能源行业大模型(非生成式),且目前已有11个行业大模型(非生成式)的输出,但具体到最新的生成式行业大模型的应用落地上,还得等几个月时间,预计会在今年之内实现。
一个毋庸置疑的事实是,即使离落地还有一段距离,但大家的确都在奔着这一方向去努力。毕竟,国内绝大部分企业的一大特色正是需要*时间考虑落地问题,将做的东西尽快变现。而大模型也只有跟用户的场景去进行大量结合,才能不断自我进化、修正和完善。正如科大讯飞董事长刘庆峰在6月9日的一场发布会上的断言,在大模型领域,“谁能在具备社会刚需的应用场景落地,谁就能*形成自我造血的良性循环。”
“我们首先要把目前已经达到的能力,尽快去落地,其次则是在语言模型的基础上去做多模态的扩充。”宋健告诉数智前线,这是他们现阶段*先级要解决的两大问题。为此,他们最近已经在将一款基于自研大模型的产品——虚拟助播进行市场推广。据介绍,基于自有大语言模型GenSense数智姜尚,虚拟助播将可以与主播及评论区进行顺畅对话,并保证快速抓屏回答问题、反馈低延时和高识别准确率。
不过,宋健也发现,在行业大模型落地的过程中,仍然有不少困难和挑战需要去解决。其中最关键的就在于,当把大模型的能力落到某个实际场景的应用产品上时,由于没有参照,其实是并不好判断具体该如何用这些模型的,“还是要做非常多的方法的革新,以及处理方式的变化”。
例如在将虚拟助播这个产品用到电商直播场景时,由于每个直播间并不一样,卖的产品品类也不尽相同,进而导致促销方式也大为不同,因此往往需要精确挖掘每个直播间的需求,探索在成本可控的情况下,如何更好地让不同直播间的数据和语言大模型去做结合。“是利用微调,还是用外部数据,又或是通过插件的方式进行,这些东西在不同场景下,用法其实是不一样的,得到的结果也不一样。”宋健解释说。
他判断,在今年下半年,大部分的行业企业可能都会将主要的时间花在如何把大模型用下去上,反而是大模型本身怎么炼制这些东西不再是重点。
当然,行业大模型的故事其实才刚刚开始。各行各业的玩家们,都对它寄予了不小的期望。
宋健所在的数字人行业,寄希望于大模型能够让数字人成功迈入下一阶段,即变得具有成长性、全面个性化,而不是像以前一样“千篇一律”。而魏佳星认为,大模型短期内有望提高智能客户的智能度,并提高增强其事后的BI能力,长期则有可能形成完全基于生成式的AI智能客服。更多的人,希望它能赋能工业质检、医疗导诊、教学等诸多更广泛的场景。
“但从逻辑上讲,行业大模型一定会是在精度相对较低、容错率较高的行业先引用,再到精度要求高的地方去。”魏佳星表示。