◎智谷趋势(ID:zgtrend)| 王延鹤
大半年,200天。
放在技术创新,动辄10年的大周期里,微不足道。
出乎意料,AI用200天就拉动了5万亿美金的财富暴增。2023上半年纳斯达克100指数涨了38%,为史上最 佳半年。
人工智能成了最重要的信仰支撑。
根据科技部的《中国人工智能大模型地图研究报告》,中国已发布79个10亿参数规模以上的大模型。
图源:中国人工智能大模型地图研究报告
短时间冒出这么多大模型,各界人士问得很实在:大模型到底能帮我们解决什么问题?
能迅速问答、写文案,画画虽然厉害,但上头的新鲜感消褪后,企业们不知道这有什么用。他们更需要专业、定制、能直接上手的产品。
通用大模型,还满足不了商业世界,有2个暂时无法逾越的Bug:
一是成本太高。
通用大模型参数动辄千亿、万亿,芯片、数据、人才等高昂成本小公司承担不起。即便大公司也还不能降低成本,提供的服务价格并不便宜。
二是通用大模型还不够专业。
虽然AI什么问题都能聊,但依然有“幻觉”、会犯错,在涉及专业知识时问题更明显。而像法律、医疗、金融等严谨行业,如果AI精准率不能达到95%以上,就无法真正商用。
作为对比,彭博打造的BloombergGPT,参数规模500亿,不到GPT-3的三分之一,但在金融领域的表现出色很多。
一个新的共识快速达成:通用大模型,只是少数人的游戏;下一阶段,机会在行业大模型。
京东的言犀大模型,直接定位产业大模型,“把供应链做透,把大模型做实”。优先围绕供应链落地产业,用数智供应链训练产业大模型,落地零售、物流、供应链、健康、城市、金融等行业。
华为云的盘古大模型,声称“不做诗,只做事”,聚焦行业场景、垂直领域;腾讯云宣布做行业大模型解决方案,“企业需要的,是在实际场景中真正解决了某个问题,而不是在100个场景中,解决了70-80%的问题。”
ChatGPT网站流量在6月也环比下降了9.7%。OpenAI也更倚重对B端客户开放API,并想打造一个集合各类垂直模型的“模型商店”。
如今,AI大模型的牌桌上坐满了人。
商业之路:从北坡攀登
比尔·盖茨说:我们总是高估未来2年的变化,低估未来10年的变革。
AI公司们选择“接地气”,是基于一种实用主义的考量。
著名IT咨询公司Gartner,在90年代发明了“技术成熟度曲线”(Hype Cycle),形象描述了一个新兴技术成熟的过程。
图示:Gartner2022年新兴技术成熟度曲线
过程分5个阶段:科技诞生的萌动、预期膨胀的顶峰、泡沫化的低谷、复兴的长坡、生产力的高原。
大模型早就不是AI领域的第 一次浪潮了。
1950年,图灵问出了“机器能否有人类智能?”;1958年,美国达特茅斯会议上,正式提出人工智能的概念。
60年代第 一次AI浪潮,诞生了聊天机器人的老祖宗Eliza。
只有几百行代码的Eliza,模仿了心理医生的交流方式。
Eliza:什么事困扰着你?
用户:男人都一样。
Eliza:怎么说?
用户:他们总有事情来骚扰我们。
Eliza:你能举个例子吗?
用户:嗯,是我男朋友让我来的这里。
Eliza:你男朋友让你来这?
用户:他说我很多时候都很沮丧。
Eliza:我很抱歉听到你很沮丧。
用户:是的,我不开心。
“AI很快就会与人类毫无分别”,人们满怀信心,但ChatGPT诞生在60年后的今天,让这一切像个轮回。
国家科技战略里,人工智能的重要程度迅速上升,各地出台政策驱动AI产业扩张。
数据来源:人工智能创投数据库
技术已不再是*的壁垒,产业纵深和商业能力才是。
原先做细分技术、小场景、工具软件的公司,都可能被淘汰;在某些行业布局早、积累深的AI公司,都在转型垂直大模型;随着大模型开源,更多创业机会聚集在应用层和中间层。
接下来,能否快速规模化、商业化,这些最现实的问题,才决定了谁能穿越长坡。
京东集团CEO许冉表示:“从产业端切入大模型,如同从北坡攀爬技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景,有巨大的探索价值。”
AI一定要和产业结合起来,赋能千行百业,才能创造价值。
大模型,到产业中去
国外大模型,往往先在实验室里打磨成熟,但硅谷之外的现实是复杂的。
有人跑去采访亚马逊,问微软谷歌先做了大模型,你们不着急吗?
亚马逊云AWS的CEO回答:在一场10公里的比赛里,有人先走了3步,这真的很重要吗?
而国内的大模型,往往是从互联网公司、各大产业端,真刀真枪干出来的。这让他们有一种极为务实的气质。
或许他们并不一定像ChatGPT、Midjourney那样新奇,但在我们的推荐算法、电商营销、城市大脑、产业集群背后,都已经有大模型的技术支撑。
在国内科技大厂里,京东目前是最晚一个官宣大模型的。
在京东人眼中,人工智能是一场非常严肃的技术革命,需要具备长期主义的心态。京东不会把没有实现“色香味俱全”的菜肴端上餐桌,在内部的关键场景完成了历练和实践的大模型,京东才会开放给合作伙伴,带动整个行业降本增效。
京东言犀大模型的定位,就是从产业中来,到产业中去,服务产业需求,AI for Industries,而非去做炫技、秀肌肉的事情。
在京东做电商,已经能明显感受到大模型带来的效率提升。
商家想要卖货,可以先用京东云AIGC内容营销平台,大模型会给商家呈现当下的消费趋势,帮你分析某种产品特征,洞察未来的潜在商机。只需要上传一张产品图片,就能自动生成商品图、海报、卖点、详情等营销素材。
图示:大模型在具身智能上的应用
一个新的商家,开店、上品、营销的周期和物料准备,从7天缩短到半天。
做直播电商的人,每天要花费至少5小时去想剧本和文案,但借助电商知识增强模型K-PLUG,可以一键生成真实、生动可阅读性强的文案。文案又无缝对接进言犀数字人大模型,立刻开始直播。
今年的618,有4000多家品牌使用了言犀数字人,带动了8亿元的GMV。对于没有直播经验的中小商家和个人来说,数字人直播的门槛很低,只需要5分钟的拍摄,就能生成一个形象、音色、动作等都可以定制的数字人。
除开电商零售的大本营,京东的大模型也已进入专业的健康领域。
我们都知道,中国医疗资源存在很大供给不足,尤其是优质医疗资源,基本都集中在大城市。
大城市的三甲医院,挤满了千里迢迢来看病的外地患者,而医生也对他们缺乏了解,诊疗时间极为有限;在急诊室里这些问题会被放大,患者已无法表达,家属又带着情绪,医生一边要沟通,一边又要争分夺秒做判断。
京东健康整合大模型能力,希望能够加快医疗资源跨越鸿沟,通过技术实现共享。大模型能帮患者管理个人健康,建立病史信息,形成AI私人医生;而这些信息和知识图谱,也能辅助医生更高效地沟通和诊疗。
不仅如此,京东健康超3千万高质量数据积累,百万级规模医学知识图谱,和庞大的医疗专家团队,都能通过大模型转化为医疗服务调度能力。
这样的例子还有很多。
图示:京东云重庆超算中心
京东因为在零售、物流、金融、健康、城市等行业多年的积累,所以首先在这些行业应用。
而京东也开放了言犀AI开发计算平台,为用户提供从基础设施、模型到应用的全周期复苏,也即是真正的MaaS,模型服务。将使用大模型的门槛尽可能降低,让没有AI技术人员的企业也能拿来就可上手,并开始积累自己的数据资产,形成自己的模型。
而数字化程度越高的行业和企业,在基础设施、数据积累、技术储备上都更充分,也会率先进入智能化,进一步降本增效、带动增长的飞轮。
京东言犀,从产业中来
近百大模型公司推出,一场综合实力的碰撞近在眼前。
7月13日,2023京东全球科技探索者大会暨京东云峰会在北京召开。大会要讲清楚一件事,就是京东言犀大模型的优势何在?
京东当初自营零售、自建物流的战略选择,成本投入巨大,但到今天看是一笔划算的投资,因为京东获得了在中国产业链独一份的深度积累。
反应到数据上,京东连接着超千万的商品SKU,服务超800万家活跃企业客户,与全国超2000个产业带达成深度合作。
京东定义自己是一家以数智供应链为基础的新型实体企业。
中国在产业上最不可替代的竞争力,是我们的生态,是我们完备的工业门类,是超大产业集群,是遍布全国的新基建。
图示:京东物流全自动智能仓内的“地狼”机器人
京东集团副总裁、京东科技产品与解决方案总裁高礼强认为,长链路、复杂协同、更加动态交互的京东内部产业场景,积累了更多专业知识和高质量数据,成为AI大模型最 好的练兵场。
京东的战略明确:只有将供应链做透,才能将大模型做实。
而在大模型向产业去的新时代,算法、算力、数据的AI三要素,也都需要升级。
京东AI算法迭代时,首先考虑的也是产业需求。2021年推出十亿级模型K-PLUG,为电商生成了30亿字的商品文案;2022年,推出百亿级模型Vega;2023年千亿级的新一代言犀大模型,将深入零售、物流、金融、健康、政务等垂直场景。
算力层面,是当下舆论关注的焦点,尤其是芯片。每个大模型的训练过程,都需要成千上万张芯片支撑。微软数十万张芯片储备,都不够供应OpenAI和必应使用。
京东探索研究院院长、京东科技智能服务与产品部总裁何晓东博士认为,谈到算力,大家过去更关心单个芯片的算力,即不同芯片各自的Flops(每秒浮点运算次数),现在大家更关心集群的算力,集群成为了新的要素。
早在2021年,京东就在重庆落地了全国*基于SuperPOD架构的超大规模计算集群——天琴α,使用的是英伟达A100芯片,算力总规模达到135T Flops,推理提速6.2倍,推理成本节省90%。同时,京东也在和寒武纪、华为昇腾等合作进行国产替代,研发异构算力的能力。
而在数据上,京东言犀大模型的训练数据,是由70%的通用数据+30%京东数智供应链数据组成。数据集上的差异,会直接让京东的模型在产业和真正商业场景里,表现更加精准、可靠。
围绕着数智供应链布局,京东云与全国超2500家大型企业、250万中小企业进行产业协同,并服务上百座城市的智能化管理,成为一个扎根供应链的智能经济体。
京东集团技术委员会主席、京东云事业部总裁曹鹏说:
作为一家新型实体企业,我们思考更多的是大模型如何与实体结合。大模型的真正价值,在于成为产业智能的发现工具、效率工具和创造工具。我们认为技术只有放到场景里,才能够产生实际的价值。
当创业者还在卷聊天机器人时,京东云已经在产业升级、数实融合的道路上释放技术红利了。
结语
回顾过去几个世纪,每个百年的霸主,都是率先完成了科技大突破。
科技霸主的技术溢出,给了后发国家弯道超车的机会;而科技霸主的封锁与围堵,对应着后发国家的创新和突围。
这两股力量的博弈,从英国的蒸汽时代工业革命,到之后电力、计算机,到今天我们正在经历的第四次工业革命,一直在延续。
如今大模型带来的新技术革命,之所以让人们欣喜若狂、热情跟进,都希望用AI带来的生产力飞跃。
就如同电脑和iPhone的发明,互联网的壮大,都从一个新时代曙光中,打破了旧的博弈格局。
中国的大模型们,也在走一条更务实、与众不同的道路:成为科技跨越发展、产业升级、生产力跃升的“新引擎”。
虽然道阻且长,但变革已经开始,世界又重新开始加速。