算力焦虑该怎么破？|投资界

11月底，北京召开的一场以“智算力就是创新力”为主题的人工智能计算大会上，挤满了来自各行各业的数千位参会者。

在算力紧缺问题依旧未解的当下，大家关心的问题，普遍围绕大模型最新创新和落地成果，以及由其带来的算力、AI infra（AI软件基础设施）等方面的创新和变化。

业界人士观察，今年很可能会是从移动互联网时代迈向智能时代的关键一年。过去从互联网转向移动互联网，大家一开始在手机上使用网页，后来iPhone开创了手机APP进行交互。而在智能时代，未来很可能不再是点开APP，而是直接弹出一个个AI Agent（人工智能代理），去实现交流互动。

“我们现在就在所谓智能时代的iPhone时刻前期，智能的iPhone时刻随时可能发生。”IDC中国副总裁周震刚做了一个比喻。

在这种背景下，国际数据公司（IDC）与浪潮信息在大会现场联合发布的《2023-2024年中国人工智能计算力发展评估报告》（以下简称报告）也受到不少关注。

1、大模型辐射面远比想象要丰富

中国企业对生成式AI的接受程度，可能已超出你的想象。比如在一些想象不到的行业和领域已经开始投入大模型。

近期，手机公司在大模型上动作频频，包括小米、vivo、OPPO、三星等在短短一个月内，接连亮出了10个以上的AI大模型，参数规模从十亿级、百亿级到1300亿不等。但你可能很难想象，手机背后的芯片公司，也在尝试引入大模型。

比如上海的一家手机芯片上市公司，尝试利用大模型解决传统客服问答系统智能程度不高的问题。过去，因为芯片品种有上千种，且涉及大量技术专有名词、参数信息，技术服务团队在本职工作外，需要投入大量时间帮助确认细节。而现在，他们通过大模型的语义理解和判断推理能力，解放一线技术工程师，实现降本提效。

生物医疗领域同样是对大模型探索较多的行业，有数据显示，今年以来，国内已发布近50款医疗大模型。医学科研、药物研发、智慧诊疗、医院管理等都是被探索的方向。但你可能很难想象，国内一些花卉研究所，正基于大模型打造花卉AI育种大模型。

汽车界对大模型的探索也不少，包括吉利、奇瑞、红旗、智己等多家车企都曾宣布接入大模型产品，大家都在争夺谁能首先在智能座舱、自动驾驶等场景实现大模型落地。就连摩托车公司也不甘寂寞。比如成立于1993年的国内摩托车龙头企业——隆鑫通用，正在利用大模型的能力，打造面向消费者的“AI骑行助理”，并试图探索大模型在摩托车发动机的生产质量管控、全地形车的智能化改造等方面的应用。

IDC和浪潮信息发布的《报告》，也从数据层面印证了这一点——67%的中国企业已经开始探索生成式AI在企业内的应用机会或进行相关资金投入。

“中国企业尤其认可生成式AI在加速决策、提高效率、优化用户和员工体验等维度带来的价值，并将在未来三年持续提高投入力度，超过七成企业增幅达到20%-40%。”IDC中国副总裁周震刚介绍。

当然，在这波大模型建设热潮中，拥有更多的先发优势和投入动力的，还是原先就在AI上积累更深、AI渗透度更高的行业。

可以看到，在2023年人工智能行业渗透度排名中，Top5的行业依次为互联网、电信、政府、金融和制造。交通、服务、教育等行业在人工智能领域的投资力度也可圈可点，分别位列第六至八名。

其中，高居首位的互联网行业，在最新的生成式AI热潮中，依然是大模型和AIGC技术应用和研发的主战场。李彦宏一度表示，百度要用大模型把全部产品重新做一遍，且“不是整合，也不是接入，是重做和重构。”

而渗透度排行榜上*的“黑马”——电信行业，反超政府和金融，跃升至第二名。在最近一两个月，电信业加快了在大模型上的进程，三大运营商也都亮出各自“最新的基础大模型+多个行业大模型”。

至于“财大气粗”且一向对技术有着较高追求的金融行业，更是从今年初ChatGPT一火起来，就对大模型技术进行投入。

这一火爆，直接带来智能算力的“暴增”。IDC的数据显示，2023年，中国通用算力规模预计达到59.3EFLOPS，同比增长8.8%；智能算力预计达到414.1EFLOPS，同比增长59.3%，6.7倍于通用算力增速。

2、算力新挑战

大模型时代，“卖铲人”的生意先红火起来。

典型如英伟达，因手握大量GPU资源，今年以来，一直在“开挂式”大丰收，不仅年初在资本市场首次突破万亿美元市值，之后更是拿到了雪花般的订单，收获了真金白银。

最新财报显示，8月到10月的单季度内，英伟达总共向全球大量的数据中心，出售145.1亿美元的芯片，远高于去年同期的38亿美元，也高于市场预期的127亿美元，同比增长324%。

国内的“百模大战”，也为英伟达带去不少生意。2024财年第二财季财报会上，英伟达高管曾透露，英伟达数据中心业务收入的20%至25%都来自中国市场，已创下历史新高。

不止是底层芯片厂商，算力产业链上其他各个环节的提供商们也都尝到了不少红利。比如服务器端，《报告》显示，2023年上半年，中国人工智能服务器市场规模达到30亿美元，同比增长了55.4%，预计全年将达91亿美元，同比增长82.5%。

与此同时，由于大模型对计算能力和数据的高需求，2023年至2026年，全球用于运行生成式AI的服务器市场规模在整体人工智能服务器市场的占比将从11.9%增长到31.7%。

“今年的一个特殊情况是，大家抢卡比较厉害，导致服务器的支出增长非常快。”IDC周震刚告诉数智前线，随着供需关系趋于平衡，这种高增速预计将在明年放缓，但鉴于算力需求持续上涨，中国AI服务器市场规模还将在未来五年以21.8%的年复合增长率持续增长。

机遇陡升的同时，这个市场也在面临一些新挑战。一方面，单芯片算力已经遇到瓶颈，提升空间有限；另一方面，算力依旧紧缺。这两点上，全球市场无一例外。

当然，中国市场的情况可能还要更严峻一点。一位资深人士告诉数智前线，国内市场今年几乎九成加速计算的能力都由英伟达所提供，仅一成由国产芯片厂商提供，算力短缺问题，依然待解。

此外，各行各业在进行大模型探索和应用的过程中，也存在各种意想不到的挑战和问题。比如，有企业在使用AI集群，对面向场景的AI大模型进行训练时，发现服务器中的CPU到GPU之间的通信带宽，和存储到服务器之间的通信带宽没法同时跑满，导致模型数据不能及时从存储读取，GPU空闲和训练性能低下。

如何在有限的算力下，更高效、低成本、少差错地进行大模型及生成式AI的应用和落地，已经成为许多企业都要面对的问题。

在此背景下，报告认为，国内有关智能算力供给能力的衡量标准正在加速演变——用户在获得算力服务的过程中，会更加以应用为导向进行综合考量，增加对于诸如单位时间可处理Token数量、可靠性、时延、训练时间和资金成本、数据集质量等指标的关注，而不再是仅考虑硬件性能。

这也要求算力供应商做出相应改变。《报告》指出，算力供应商需要“以应用为导向、系统为核心”，构建算力基础设施平台，提高算力利用率，提升诸如卡间互联、多节点间互联等水平，支持灵活稳定扩展和弹性容错，积极打造通用的人工智能软件和硬件平台，以先进的系统性能力满足市场的应用需求。

换句话说，与其过分关注单一芯片的性能强弱，不如根据人工智能业务场景需求，设计更具针对性的算力系统，实现整体性能*。换一种思维，打破算力困境。

3、业界的新解法

面对算力市场的新机遇和新挑战，包括云厂商、服务器厂商等在内的诸多算力供应商，正在快速反应。

“基本上几个大的云服务商，都已经意识到大模型时代，智能计算的经营模式会和过去传统的云计算模式发生比较大的改变，因此都在重新去组织自己的计算能力。”周震刚告诉数智前线。

比如，百度云、华为云、阿里云都表示，将通过从底层算力到AI平台再到模型服务的全栈技术创新，升级云计算体系。MaaS（Model as a Service）已成为云厂商的服务体系的重要一层。

而在更底层的服务器端，同样带来了服务需求的变化，甚至需要厂商的转身。“我们认为，应该从算力系统、AI软件基础设施（AI infra）、算法模型和产业生态4个方面来进行综合考量，加速智能产业的落地。”浪潮信息高级副总裁刘军表示。

业界观察，服务器企业也在加速AI infra的进展，这是一个新动向。浪潮信息在今年8月推出了大模型智算软件栈OGAI“元脑生智”（Open GenAI Infra）。

它包括L0的基础设施层（智算中心OS）、L1的系统环境层（PODsys）、L2的调度平台层（AIStation），L3的模型工具层（YLink）和L4的多模纳管层（MModel）。各层对应不同的应用场景，且分层解耦，用户需要哪些工具，就能调用哪些。

这也是算力供应商“以应用为导向、系统为核心”的典型例证。类似的还有百度在千帆大模型平台上提供的工具链。腾讯、阿里等也都有相应服务出来。各家大厂的普遍思路是，持续更新迭代自己大模型的能力，同时又为大模型的训练和推理，提供训推经验、数据、计算、存储、网络等涉及方方面面的全套工具链和服务。

另外，在算力系统层面，打造开放多元的AI算力平台，解决目前多元算力共存的问题，也是未来几年产业大趋势。如浪潮信息发布的G7算力平台，采用开放多元的架构设计，支持最广泛的通用处理器和加速芯片，同时将整个集群的性能加速比提升至超过90%，从而保障更大规模的集群扩展性能。

大模型的浪潮还在继续，移动互联网时代迈向智能时代的大门即将打开，在这个关键转折点上，反应速度的快慢往往决定了谁能更快抢得先机。周震刚建议，用户应该要尽早去拥抱这个趋势，供应商也应尽早适应和跟上算力市场的改变。

打开投资界APP 阅读全文

【本文由投资界合作伙伴微信公众号：数智前线授权发布，本平台仅提供信息存储服务。】如有任何疑问题，请联系（editor@zero2ipo.com.cn）投资界处理。

资讯

7×24快讯

数据

会议

算力焦虑该怎么破？

数智前线

相关资讯

周鸿祎：发展大模型要有AI信仰

「HiDream.ai」获新一轮融资，科大讯飞创投基金领投

清华系AI公司「幂律智能」获蓝驰领投8000万元融资

AI数据总览

最新资讯

航空动力企业「鸿鹏航空」获数千万元A+轮融资，扎根珠海及大湾区

国产恐怖片要回春了吗？

浅谈上海市街镇数字化经济运营管理平台的应用

热门TOP5热门机构 | VC情报局