问题的由头,源于近几年国内公有云的实际市场表现:几乎从2022年开始,中国公有云的市场就处在一个增速放缓的状态。官方给出的一些表述是:市场正在迈入平稳的发展期。
相比之下,虽然数据统计的口径存在差别,不过整体看来,全球的云计算市场仍维持高速的增长,公有云中AWS、Azure这些国外巨头依然坚挺。也就是说,市场对云尤其是公有云的需求还是确定的。
在这种情况下,国内的公有云市场近几年谈及很多的话题:一个是降价,另一个是出海。
阿里云打响降价*枪后,其他云厂商也相继跟进降价。究其原因,无外乎几点:市场竞争加剧,厂商争夺份额,国外也是这么玩的;公有云服务商的规模不断扩大,其运营成本也在逐渐降低,从而进一步扩大份额,实现规模利润;再者就是技术进步,成本降低达到普惠的效果。
降价趋势对于企业和开发者来说,意味着更低的IT成本、更高的灵活性和更多的选择。当然也不得不承认,这也说明厂商的基础产品功能的同质化,包括云主机、对象存储和各种数据库,以及各种拖拉拽建站模板,没什么额外的突出竞争力了。
出海是玩家寻求的另一条出路,比如阿里云降价后,那么降价策略就是它在海外争夺市场的一种手段。需要注意的是有个前提,阿里云在国内的降价效果一度不太乐观,他们也公开承认过这点,所以目光投向海外的同时,还在不断扩大产品和客户的降价范围。
就像阿里云的公有云事业部总裁刘伟光说的,事实上,现在中国很多企业没有云计算,没有使用公有云或者没有享受到公有云带来的真正价值,或者把云作为服务器资源。言下之意,国内客户对公有云的买单情况不理想,所以他们想通过降价来激励企业们纷纷上云。
但这两年,公有云增速放缓的同时,还有另一个让云厂商紧张的趋势旁逸:一些企业开始下云。那么这背后的考量,又是什么呢?
1、逃离公有云
关于最早实施“下云”(CloudExit)的公司的确切身份,并没有一个明确的记录或共识。不过将这件事变成热点的,马斯克功不可没。
2022年马斯克把Twitter收入囊中并改名X,之后就对这家公司进行了一系列大改革,主要目的是降低公司运营成本,其中“削减云服务和额外的服务器”是重点动作。
比如,通过关闭萨克拉门托数据中心并重新配置服务器,X公司每年可以节约超过1亿美元的成本。此外,优化云服务使用方式和在本地运行更多工作负载,使X公司的月度云成本降低了60%。
这个数据打破了很多人的认知。一般来说,上云的目的就是为了节省成本,传统的IT系统需要购买硬件设备、搭建机房、维护网络等,这些都需要大量的资金投入。
而云计算采用按需付费的模式,企业无需购买和维护自己的服务器和硬件设备,只需要支付实际使用的资源费用。而且云服务提供商通常会负责系统的维护和升级,企业就无需承担额外的维护成本;云计算的高度灵活性和可扩展性,也让企业可以根据业务需求快速调整资源。
马斯克的这一操作,让业界重新审视了云计算的成本效益。云计算长期运行的成本可能并不总是如预期的那样低。不过,业界更注意到的是,X并没有放弃云计算,而是采用私有云的形式继续运转公司的业务,特别是在数据量巨大、需要频繁处理和分析的情况下,本地或私有云解决方案可能更具成本效益。
值得一提的是,逃离公有云的不只是马斯克,几乎在同一时间,37Signals的联合创始人David也官宣离开用了多年的AWS和Google Cloud公有云。之所以往后也不再上云,最重要的理由同样是太贵:
37signals每年付给了2家公有云的费用超过320万美元,其中一项30万用户的企业级邮件服务Hey,每年生产工作负载的费用高达一百多万美元。他们得出结论,对于稳定增长的中型企业来说,租用计算机在大多数情况下并不划算。
据了解,David估计,下云后每年至少能节省150美元,本以为“下云”会像进入云端那样得花好几年,没想到只用6个月,最后一个应用就已成功迁回到本地硬件之上。
“上云的两大好处,一是在应用程序功能单纯,而且流量不大时,可以完全托管给云服务,对于创业公司很友好;再者是上云可以应对高度不规则的负载变化,比如突然爆量,或者高低落差比较大的用量,上云可以弹性解决。”
但37signals上云多年,已经是一家稳定发展的公司,复杂度没有因上云简化太多,运维团队的人数反而是逐年增加,“上云的好处已经不再是37signals的红利”David说,对比Hey刚推出时,用户量不到一个月暴增30万,现在的Hey增长已经趋于稳定。
简单来说,为了应对小概率发生的爆量情况而付出庞大的代价,在他看来一点都不成比例,如果过多地依赖专有的托管服务或无服务器方案,一旦账单开始飙升,就会发现很难逃脱。
但谈到下云最根本的动机,他觉得可以重新思考一家软件商该用什么样的网络来运行,也就是说,公司需要对自身状态适应什么样的软件运行环境重新评估。
在公有云环境中,虽然提供了便利性和灵活性,但也存在一些限制和挑战,如性能、安全性和成本等方面的问题。通过下云,公司可以更好地掌控其运行环境,选择更适合其业务需求的网络架构和基础设施。
2、别只因为炒作而留在云端
不难发现,具体实践之后,上云还是下云,既取决于企业的发展状态:大部分国外公司认为,对于那些处于生命周期早期、支出微不足道或者2年内可能无法继续经营的企业来说,云是有用的;当然也取决于不同方案下的开销对比。
美国知名的科技公司Citrix做了一项研究,有42%的公司已经有了下云的打算,而被调查的350名IT*,有94%在过去三年里参与下云的项目。这就意味着,下云不仅仅是一个概念或趋势,而是已经在实际操作中得到了广泛地实施。IT*们正在积极响应并推动这一变革,可能是因为他们看到了下云对于公司业务的潜在好处。
如果将目光放到国内,这样的需求同样存在,在过去至少十多年,上云都是企业的政治正确,甚至成了衡量一家公司数字化程度的重要标准,但事实上很多人会忽略云租赁这一模式下,后期滚雪球带来的成本巨大。
假设一家中型企业在公有云上运行核心业务,随着业务的发展和扩张,云资源的使用量也在不断增加,因为增长通常是非线性的,因此成本也会以非线性的方式增加。在初始阶段,该企业可能每月只需支付约10万美元的云服务费用,这包括虚拟机、存储、数据库、网络带宽等资源的费用。
然而随着业务的发展,该企业可能需要增加更多的虚拟机来处理工作负载,可能需要成百上千的虚拟机,有更多的存储空间来保存数据,以及可能需要更高的网络带宽来支持更多的用户访问。这些资源的使用量增加会导致云服务费用的增加。
需要注意的是,公有云通常采用订阅模式,企业必须为所使用的资源持续付费,那么即使在不活跃的时间段,只要资源被分配并保留,就需要支付费用。另一方面,将数据从云服务商的网络发送到公网的过程中,费用通常基于传输的数据量来计算,一些云服务商可能会对每个GB的出口流量收取几美分到几美元不等的费用。
这也是很多企业后期选择下云的直接原因。
此外,随着数据量的增长,数据备份、恢复和归档等服务的费用也会增加。同时,为了保障业务的安全性和合规性,企业可能需要购买额外的安全服务,如数据加密、入侵检测、身份管理等,这些服务也会增加云服务的总开销。
在后期,如果这家企业的业务继续保持快速增长,公有云服务的开销会迅速增加。例如,假设虚拟机数量从100台增加到500台,每台虚拟机的月费用为200美元;存储需求从1TB增加到10TB,每TB的月费用为1000美元;网络带宽从1Gbps增加到10Gbps,每月的网络费用为5万美元。此外,额外的安全服务如数据加密服务每月1万美元,入侵检测服务每月2万美元等。
把同样的场景搬到中国,虽然同样也要考虑费用问题,但事实上国内的中大型企业,尤其是国企、政企单位,这些云厂商的大客户,他们更在意的其实是信息的安全和合规问题。
3、公有云的黄金时期已经过去了?
从市场份额上看,公有云的确*数年:中国信通院数据显示,2019年,我国云计算整体市场规模达1334亿元,增速38.6%。其中,公有云市场规模达到689亿元,相比2018年增长57.6%,市场规模首次超过私有云。
回想一下,五年前,随着AI、5G、AR等技术的日益成熟,国内诞生了大量的新兴IT企业,政策推动下,传统行业也迈入数字化转型的快车道。以阿里云为代表的公有云厂商,成为中国*的云计算厂商,多年蝉联中国市场*,带动了整个公有云市场的快速增长。
那么时至今日,很多没成规模的科创公司,并没有实现持续的发展,其中再小一些的公司,他们并不能够负担得起公有云长期的费用,在公有云之外,其需求也有更具性价比的方式满足替代。
这也是为什么会有人认为,公有云的受众,只适合那些非常早期或两年后不复存在的公司,以及那些完全不在乎沉没成本的公司,流量上大起大落的电商型公司,以及要面对出海合规的公司。
在大型的国企及政企客户上,公有云在财务报表中被视为资本支出,而私有云则是固定资产。虽然私有云的摊销成本可能更高,但在报表上仍然体现为存量资产,这更符合国企和政企机构对于国有资产保值增值的需求。
这些企业的领导人员会为任一可能性的风险感到顾虑,比如,如果云供应商倒闭或停产,那么云软件也就不复存在了,用这些软件创造的文档与数据就被锁死了,所以他们非常讨厌被外部供应商集中式的管理和锁定。
但一方面,阿里云、腾讯云这些由互联网大厂背书的云时不时出现宕机等事故;另一方面,公有云的数据不在本地部署,出现事故时权责难以理清,本地部署的云由自己掌握,更符合监管和安全要求。
所以能够看到,在近几年,公有云市场缩水的同时,阿里云的份额也正在被压缩,从30%以上,掉到了20%左右,而他丢掉的市场,被华为云、天翼云、移动云这些更具有特殊意义的公司分食。而在科研、高校、政务、金融这些领域,具备定制化优势的混合云和专属云对公有云的侵蚀也很直观。
除了以上,很多原本作为云厂商客户的互联网及科技公司,现在也不选择为别家的公有云买单,比如字节,之前一年要花几个亿用来租公有云,现在不仅每年花几个亿搭机房,还孵化出了一家云计算公司火山引擎。
以前下云的时候,David强调,云服务商总喜欢搞一大堆新概念,比如“按需计算”,听起来很酷,感觉比“租计算机”整整*了一个世纪,但二者并没什么本质区别,只能说是营销技巧非常高超。
同样的道理,当前AI火得一塌糊涂,各行各业都在进行AI改造,加AI的概念,但具体改成什么样,实际上也没有想清楚,这里同样包括云计算的厂商。
不过也存在转机。
AI助理能够接替传统的项目管理工具,改变的虽然仅仅是人机的交互形态,但对于David掌管的这些公司,比如basecamp、Hey,他们或许也要完成AI方向的转型,从而维持当前的稳定水平。那么是否意味着,为了应对业务的快速变化,要重新考虑回到上云作业,以及当下购买的物理服务器和自建机房,会不会在未来成为负资产。
在国内的AI浪潮下,阿里云率先提出了“公共云优先”策略,在他们看来,公有云是AI大模型必须走的一条路,一个大模型动辄需要成千上万张卡才能训练出来,推理应用阶段也要庞大的算力支撑。所以它天然就需要一个分布式的计算架构。
加上迎头赶上的降价潮流,上云和下云之间谁更划算,企业在决策的时候可能需要重新去衡量。