日前,华为轮值董事长胡厚崑说道,科技革命经过了数次浪潮,从互联网到移动化到云计算、到人工智能,每一轮的变革都给社会带来了深远的影响。毫无疑问,今天通用人工智能(AI)正给我们无穷的想象空间,也正带领我们走进下一个黄金十年。
当前,人工智能、大数据应用进入快速发展阶段,自动驾驶、机器人、AR/VR、元宇宙等应用加速落地,传统数字基础设施难以满足大模型、多模态等新型技术发展,拥有强大集群算力的新型数据中心成为突破人工智能发展瓶颈的重要基础。
DPU作为突破数据流量指数级增长带来的性能瓶颈的关键技术,通过算力卸载、算力释放和算力拓展,释放CPU的计算资源,实现任务加速处理,提升整体计算效率,达到降本增效,产业赋能价值凸显。因此,也成为构建新型算力基础设施的重要基础部件和下一代芯片技术竞争的高地。
DPU也被预测为2023年的十大科技趋势之一,这份“洪荒之力”发展的如何呢?
01
“新贵”是怎样练成的
有人说,DPU 将成为未来计算的三大支柱之一,未来的数据中心标配是:CPU + DPU + GPU 。
DPU 最直接的作用是作为 CPU 的卸载(offload)引擎,其效果是给 CPU“减负”。《DPU技术白皮书》主编、中科院计算所研究员鄢贵海作了一个形象比喻,说DPU 提供了数据中心一把“杀鸡”的工具,节省的是 CPU 这把“牛刀”,以释放 CPU 算力,留给更需要它的业务负载。这个比喻也形象地说明了DPU这个新贵的定位。
DPU 通过执行以下主要功能为现代数据中心带来许多好处:
一、提高处理能力: DPU 减轻 CPU 的网络和通信工作负载,从而释放资源用于应用程序处理。
二、提高效率和性能: 通过将处理核心与硬件加速器块相结合来大规模处理以数据为中心的工作负载,DPU 可以提高性能并减少延迟。
三、处理复杂任务的能力: DPU 旨在处理大型数据中心中的数据密集型工作负载,支持云环境或驱动人工智能、深度学习算法和其他数据密集型应用的超级计算机。
四、能够满足数据中心不断增长的需求: 随着数据中心需求的增长和变得更加密集,DPU 可以进行扩展,以适应数量和复杂性不断增加的工作负载。此外,DPU 可以添加到现有的硬件基础设施中,从而实现灵活且适应性强的数据中心架构。
五、提高可靠性和可用性: DPU 可以通过冗余和高可用性等功能提供更高的可靠性,确保在发生硬件故障时关键数据处理任务的连续性。
六、降低成本: DPU 可以通过从 CPU 卸载处理任务并处理复杂任务来降低与管理数据中心相关的总体硬件成本,从而需要更少的硬件组件。
DPU、CPU 和 GPU 之间有什么区别呢?
首先在功能上, DPU(数据处理单元)、CPU(中央处理单元)和GPU(图形处理单元)都是计算处理器,各自执行不同的功能。CPU是负责计算机系统整体运行的主处理器,是计算机的“大脑”。GPU 是用于图形计算任务(例如渲染3D 图像或视频)的专用处理器。DPU 是最新的处理器,专门用于以数据为中心的工作负载,例如数据中心的网络、存储和安全操作。
其次是架构,CPU 由几个强大的处理核心组成,这些核心针对串行或顺序处理进行了优化,这意味着一项又一项任务。GPU 具有大量针对并行处理(即同时执行任务)进行优化的更简单的内核。DPU 结合了处理核心、硬件加速器块和高性能网络接口,可大规模处理以数据为中心的任务。
另外,CPU 几乎用于所有计算机设备,从智能手机到计算机再到服务器。GPU 经常用于游戏电脑。DPU 主要用于数据中心。
基于明显的优势,国外大厂已经早早地开始发展DPU了。
2019年,英伟达以69亿美元的价格收购以色列网络芯片公司Mellanox,并于同年推出BlueField-2 DPU,自此拉开DPU高速发展的序幕。
在 2020 年 GPU 技术大会上,英伟达首席执行官黄仁勋推出了名为 BlueField-2 数据处理单元 (DPU) 的全新处理器系列。开发人员可以通过软件平台 DOCA SDK 访问 DPU。DPU和DOCA SDK可与英伟达GPU硬件和CUDA软件的强大组合相媲美。
7月11日业内四名知情人士报道,欧盟监管机构将于本周三批准博通以690亿美元收购软件制造商VMware的交易。报道称,欧盟委员会将接受博通的让步,即VMware的软件将继续与竞争对手的硬件兼容。知情人士表示,这一举措已被证明足以解决欧盟竞争监管机构的担忧,而无需博通出售VMware的部分业务。
这次的收购如果成功,博通就可以进一步进军数据中心市场,特别是数据处理单元(DPU)市场,也称为智能网络接口卡(smartNIC)市场。VMware也一直在寻找自己的DPU/smartNIC市场之路。自 2020 年以来,该公司一直致力于一项名为 Project Monterey 的项目,研究其虚拟化软件如何与 DPU 配合使用。
2022年 3 月,高级技术营销架构师 Dave Morera 对该项目的描述是:“根据 VMware 的蒙特利项目,网络流量、分布式防火墙等网络进程将被卸载到SmartNIC (智能网络接口卡);这意味着不仅 x86 服务器的资源被绕过,流量本身也被绕过。蒙特利项目还将促进在 DPU 本身上安装 ESXi 和NSX,从而将所需的 CPU 资源从 x86 卸载到 DPU,不仅释放 x86 上的资源供虚拟机使用,而且还提供额外的安全层”。
除了英伟达之外,下表展示了其他国际厂商的DPU产品。
02
国内DPU起势猛
虽然国内厂商在芯片产品化的环节与国外一线厂商相比还有差距,但是在DPU架构的理解上还是有独到的见解的,而且我国目前在数据中心这个领域,无论是市场规模还是增速,特别是用户数量,相较于国外都有巨大的优势。国内厂商有望充分利用这一市场优势,加快发展步伐,在DPU这个赛道与国外厂商逐鹿中原。
国内厂商在啃的是一块新的“硬骨头”。DPU技术的特点是烧钱多、周期长、产品面向政企、很难快速上量,但是技术壁垒高、客户黏性强。同时, DPU是全球新近发展起来的一项新技术,不像很多成熟芯片已经形成了“西强东弱”的格局,在DPU上中国和西方国家没有代际差。
也就是说DPU是全球新近发展起来的一种专用处理器。国内厂商的一些产品处在从小批量到规模化应用的阶段,已经有了*批客户。当下的任务是,保持产品迭代以适应用户需求。同时,推动产品从小批量到规模化落地,再要考虑如何去复制同类客户。
然而DPU产业化的挑战很大,这包括一些供应链紧张、人才不足的共性难题,还有需求碎片化、大量兼容适配的特殊挑战,目前单颗DPU成本较高。
与存储器、CPU这种成熟产品不同,这些芯片已经被标准化,国际大厂拥有技术的、成本的优势,并善于利用产品的周期性调整价格,以驱逐追赶者。国产的道路是后发追赶式的,面临的竞争非常残酷。
DPU未来也会走向标准化。中科驭数公司的创始人兼 CEO鄢贵海说:“我们感受到的竞争氛围更宽松,而且创新的空间更大,比如我们正在研究如何将端到端的延迟从20微秒降低到2微秒,对于很多技术点,各家都有不同的实现方法,但若这项技术在国际上已经相对成熟,那国产几乎没有空间去创新了,最紧要的任务就是赶上国际的水平,做出一个自主可控的方案。”
在全球格局尚未形成之前,国产 DPU 需要利用国内的资源禀赋和更多国产芯片达成生态协同,并服务于本土的信息基础设施,在全球角逐一项新技术的关键窗口期,探索出一种“中国方案”。
其中“定制化方案”就是国产DPU很好的发展方向和布局思路。DPU是个新兴市场,客户需求还处于粗放阶段,各种方案都有适合的应用场景。因为玩家不多,客户需求比较分散,单个厂商无法服务众多客户,因此现阶段都能够通过为客户进行定制化服务获得订单。
国内未来DPU的发展和布局应采取一些差异化竞争思路,一方面,加快自主研发DPU的进程。不管是处理器架构的研发,还是网络芯片的研发,都要加快产品的迭代速度。另一方面,在商业模式上,找一些细分的产品角度进行创新。多与国内的云计算、数据中心的厂商合作,先进行小批量的产品铺设,再进行大规模的布局。