算力已经不再是简单的商业、技术问题,它越来越被产业政策、国际竞争等因素影响
文 | 吴俊宇
全球算力资源正在换挡,中国算力产业也走到了十字路口。宏观意义上的算力产业包括云计算厂商、设备服务商、芯片供应商等一系列企业。目前,全球智能算力(GPU等芯片算力)增速远超通用算力(CPU芯片算力)。整个产业链为之而动。这个关键时刻,中国算力资源正变得更分散。数据中心投资越来越热,但公有云市场增速有限。国际市场调研机构IDC和Gartner数据显示,中国公有云市场增速跌到5年来最低点。相反,数据中心投资增速达到了5年来最高点。AI算力采购成本更高、研发投入更大。理论上,算力集中在云厂商手中最经济。因为公有云容易利用规模效应摊薄成本。但理论和现实有落差。公有云被认为短期增长空间有限。本地部署的云(混合云、私有云、专属云)是未来1年-3年的主引擎。智能算力催生了大模型。大模型变革中,美国云厂商吃到了第一波增长红利,中国云厂商却暂时没吃到明显的增长红利。大模型需要先进AI芯片。但美国商务部工业安全局2023年10月向中国断供了高性能AI芯片。国产替代越来越迫切。芯片被认为是产业突围的重中之重。华为有昇腾AI芯片,是解决卡脖子问题的备选方案。但昇腾目前的技术水平,只能解决“能用”的问题,尚未解决好用、低成本的问题。算力被当作国家竞争的关键因素。中国政策部门越来越希望在算力市场贯彻产业政策,提升中国算力产业的竞争力。英伟达创始人黄仁勋称,“算力即权力”,他主张每个国家都要建立自己的主权AI基础设施。但美国商务部长雷蒙多今年1月公开演讲称,美国正在全力阻止中国获得用来训练大模型的算力。中国算力产业一系列关键问题正在浮现,它们包括但不仅限于:- 其二,公有云渗透慢给中国新算力周期布局带来哪些掣肘?
- 其四,算力领域的国产替代会到哪一步,对算力新周期布局有何影响?
算力资源为何更分散了?
大模型产业爆发带动了智能算力市场。理论上最经济的方式是,算力集中在云厂商手中。因为AI算力的采购成本更高、集群管理更难、研发投入更大,公有云容易利用规模效应降低算力成本。但是,中国和国际市场出现了不同的情况:国际市场算力正变得更集中,中国市场算力正变得更分散。《财经十一人》对比了近5年来中国和国际的公有云IaaS、数据中心投资增速,发现两者发展趋势截然相反。IDC和Gartner数据显示,2019年以来中国的数据中心投资增速不断上升,公有云IaaS市场增速下降。国际市场公有云IaaS市场增幅则是始终高于数据中心投资增速。上述数据意味着,中国市场,数据中心投资越来越热,但公有云市场没有一同升温。在国际市场,新增算力还在向几个公有云厂商集中。2023年,中国市场数据中心投资增速开始高于公有云IaaS市场增速。Gartner数据显示,2023年中国数据中心系统的支出增速为20.7%,全球市场数据中心系统的支出增速仅为7.1%。IDC数据则显示,2023年上半年中国公有云IaaS市场增速仅为13.2%,国际市场公有云IaaS市场增速为16.9%。- 一是美国对中国断供先进AI芯片,头部科技公司能获取的新增AI算力变少了。
- 二是,国内部分企业还在通过各种非正常渠道高价格、小批量转运被断供的AI芯片。
- 三是,一批地方城市期望建立AI芯片为主的智算中心,以此基建投资、招商引资。
在国际市场,微软、微软、谷歌、Oracle、Facebook、特斯拉等头部科技公司是英伟达先进AI芯片的主要买家。2023年10月之前,阿里、腾讯、字节跳动、百度也是英伟达先进AI芯片的中国主要买家。2023年10月,美国商务部工业安全局更新“先进计算芯片和半导体制造设备出口管制规则”,禁止英伟达等美国企业向中国出售先进AI芯片。随后,中国科技企业无法再通过正常渠道获取英伟达的A100/A800、H100/H800等芯片。上述芯片被认为是AI大模型训练、推理的最佳解决方案。但是,上述芯片仍在源源不断通过非正常渠道进入中国市场。多位服务器经销商对《财经十一人》表示,这些芯片的价格通常是英伟达官方定价的4倍-5倍。阿里、腾讯、字节跳动、百度等头部科技公司担心被美国商务部拉入实体清单,通常不敢随意购买这些非正常渠道的芯片。英伟达芯片价格飙升反而成了一些企业投机的好机会。一批原本从未做过算力生意的企业开始重金跨界进场。其中包括味精企业莲花健康、染料企业锦鸡实业、纺织企业华孚时尚、化工企业锦航科技等。这些企业的特点是,营收连年下滑、主业毛利率低。服务器出租这种最原始的算力生意,毛利甚至都高于主业。跨界算力后,公司股价甚至还因此攀升。但问题在于,这类跨界存在投机成分。因此,莲花健康等企业多次被监管部门发函问询。一批地方城市也在重金投资智算中心。比如,2024年哈尔滨平房区批复了4.6亿元的哈投智算中心。2023年长春公布了4.8亿元长春新区智算中心的建设计划,青岛市公布了17.7亿元的元宇宙智慧算力中心建设计划,南昌市公布了4.5亿元的江西人工智能计算中心建设计划。曾有地方智算中心人士对《财经十一人》表示,一些城市投资智算中心的逻辑是,希望以此扩大基建、招商引资、吸纳人才,推动本地产业升级。很多地方政府还会为企业发放算力券,进行市场补贴。一些数据中心的潜在风险是,利用率可能不足,甚至无法收回投资成本。地方智算中心更大隐患是,如果缺乏自我生存的能力,将需要更多市场补贴,进而带来财政负担。这还会挤压其他正常企业的市场空间。多位政策人士对《财经十一人》表示,不鼓励地方政府亲自下场建智算中心。因为这容易导致重复建设、资源浪费。2023年12月底发改委等五部委联合发布的《深入实施“东数西算”工程,加快构建全国一体化算力网的实施意见》也给出了约束条款,“八大枢纽、十大集群”之外原则上不得新建大型或超大型数据中心。
公有云渗透慢带来哪些掣肘?
算力分散对产业健康发展不利。大模型军备竞赛下更是如此。按理说,中国公有云应该规模越来越大,进而摊薄采购成本、研发成本,建立正向循环。美国三家云厂商是这个逻辑,但国内走到了相反的方向。2023年中国云市场的出现了明显的分野:阿里云、腾讯云在聚焦公有云,华为云和运营商云在发力混合云、私有云、专属云等本地部署的云。过去多年,中国云市场一直希望学习美国市场的公有云路线。美国三大云厂商普遍基于公有云提供服务。它的优势是规模大、效率高。公有云架构天然能向全球市场扩张,不断摊薄算力、研发成本。无论是供给方(阿里云、华为云、腾讯云等)还是需求方(国资背景综合性企业集团)人士都曾对《财经十一人》表达同一个观点:公有云算力的效率最高、成本最低。从全球云计算技术发展方向看,公有云才是最理想的方向。不过他们也共同提到,现实情况是,中国的公有云渗透率在短期内很难大幅提升。 公有云的设想过去几年在中国市场不断碰壁。最积极使用公有云的互联网行业近几年持续低迷,公有云需求不足。政企行业占据IT支出大头,却更加青睐私有云、混合云、专属云(专属云是一种介于私有云和公有云之间的形态。很多城市云、政务云项目中,被部署在当地,拥有独立资源池,采取托管形式。它不像公有云一样用纯租赁模式,一般不部署在云厂商集中管理的数据中心中)。哪怕是面对大模型这种新技术,中国政企市场仍在延续建私有云,用私有化模型的做法。政企行业排斥公有云的原因有几种:其一,公有云的数据不在本地部署,出现事故时权责难以理清。本地部署的云由自己掌握,更符合监管、安全要求。其二,政企机构考虑到国有资产保值增值,更倾向私有云而非公有云。因为在财务报表中,公有云是资本支出,私有云是固定资产。哪怕私有云的摊销成本更高,最终报表上依旧体现为存量资产。一位中国云厂商战略分析人士对《财经十一人》直言,公有云最大客户群是互联网行业,但中国互联网行业长期低迷。他所在的云厂商判断是,未来3年政企才是主战场,混合云、私有云、专属云是中国云市场的主引擎。2022年8月Gartner数据显示,中国混合云采用率在2021年达到了42%。Gartner当时预测,2024年中国混合云渗透率将到70%,远高于50%的全球平均水平。现实的确如此,中国公有云市场增速在持续下滑。本地部署的云(混合云、私有云、专属云)在稳定增长。2023年,中国公有云市场增速已跌至历史最低点。IDC数据显示,2023年上半年中国公有云市场规模(IaaS/PaaS/SaaS)为190.1亿美元,2023年上半年同比增长14.7%。其中,IaaS市场规模112.9亿美元,同比增长13.2%;PaaS市场规模32.9亿美元,同比增长26.3%。中国公有云市场的整体增速低于国际市场。2023年同期,全球公有云市场规模3155亿美元,同比增长19.1%。阿里云、腾讯云等公有云业务为主的厂商市场份额不断下滑。2023年,阿里云在公有云IaaS市场份额首次跌落30%关口。华为云、天翼云等有混合云/私有云业务的厂商市场份额均有所上升。IDC仅公布了专属云市场数据,没公开混合云、私有云市场数据。专属云市场仍在稳定增长。2023年上半年中国专属云市场规模154.3亿美元,同比增长26.6%。前五强份额分别是,中国电信(18.7%)、中国移动(12.0%)、浪潮(11.6%)、中国联通(10.3%)、京东云(10.2%)。私有云过多,不仅会导致中国算力产业碎片化,还会导致软件服务业碎片化。因为背后的产业生态是人力密集型的,边际效益随着人员增加而递减,进而无法投入巨额研发成本进行创新。云厂商技术人士的共识是,在大模型军备竞赛中,中国算力产业如果想建立建立规模、成本优势,就应该坚持公有云的技术方向。公有云上容易长出创新企业,会带来繁荣的软件生态。
大模型让算力产业迎来了新的增长机会。中国云厂商普遍期待,大模型能让云市场摆脱过去2年多的低迷。不过,从财报数据看,美国云厂商吃到了第一波增长红利,中国云厂商暂时没吃到明显的增长红利。2023年下半年开始,美国云市场因大模型开始复苏。2023年微软智能云营收962.1亿美元,同比增长17.6%;亚马逊AWS营收907.5亿美元,同比增长13.4%;谷歌云营收330.9亿美元,同比增长25.9%。微软是其中表现最亮眼的一家。大模型技术带动下,2023年三季度、四季度,微软智能云营收增速还在不断攀升。亚马逊AWS、谷歌云营收增速略有回升。2023年中国云厂商的增长和大模型关系不大。2023年阿里云全年营收增速低于4%。天翼云、移动云2023年上半年营收增速超过50%。《财经十一人》多方了解到,2023年华为云营收增速为36%。天翼云、移动云主要受益于政企总包项目,华为云受益于混合云和数据库等PaaS产品。多位云厂商高管对《财经十一人》直言,一些客户只是从云厂商手里买了芯片、服务器等硬件。训模型、用模型进展有限,但这才能真正发挥大模型的价值。他们的判断是,随着商务谈判、落地交付逐步推进,2024年一季度后国内大模型商用案例才会批量出现。届时,大模型才会对云厂商产生业绩拉动作用。微软最早吃到了大模型红利。它一直是中国云厂商的学习对象。目前,微软形成了“云+软件+AI”三条轮动增长的曲线。微软的云业务,营收增速在20%-30%之间,毛利率约为60%;软件业务营收增速在40%-60%之间,毛利率高达80%;AI算力营收增速甚至超过100%。三条曲线构成了合力,其中云是资源和底座,软件会带来客户黏性、现金利润,AI会带动资源消耗、革新软件体验。一位华为云高管今年1月曾在一次小规模的媒体交流中表示,华为云无论是战略规划、市场调研都瞄准了微软。华为和微软有很多相似之处。微软长期扎根政府和大企业市场。微软除了Azure云服务,还有Power Platform开发平台、Dynamic开发平台、Office企业版、GitHub开源社区等一批著名的企业软件产品。他进一步解释,华为云也有一批“尖刀产品”,包括昇腾AI算力、大模型、数据库、软件开发生产线、大数据、云办公、云安全等。中国市场,只卖云资源已经没办法打动客户。为政府、金融、制造、能源等行业匹配“尖刀产品”才能奏效。
中国算力产业另一个重要影响因素是——国产替代。国产替代是被动之举,但这是中国算力产业链化掌握主动权的唯一方案。中美科技对抗、全球地缘冲突正加剧。为应对断供等黑天鹅事件,中国国产替代进程在加速。这意味着,芯片、服务器、操作系统、数据库、存储等,要全部替代成本土产业链的产品。其中,先进AI芯片是国产替代的重中之重,它会直接制约中国算力的技术上限和使用成本。2023年10月美国商务部工业安全局向中国断供先进AI芯片。美国商务部长雷蒙多今年1月公开演讲称,美国正在全力阻止中国获得用来训练大模型的算力。此后,中国科技公司难以获得大模型训练所需的先进AI芯片,算力成本大幅提高。非正常途径获取芯片,可能会被拉入实体清单,采购成本通常是英伟达官方定价的4倍-5倍。算力成本高,大模型的产业落地、市场普及会更难。美国限制高端AI芯片出口,国内厂商采用国产芯片的进程被迫加速。华为成了解开死结的关键企业。《财经十一人》多方了解到,中国企业无法正常采购英伟达A100/A800、H100/H800等芯片后,最现实的国产替代方案就是昇腾。2023年华为昇腾AI芯片的产能为30万-40万片。包括腾讯、百度、字节跳动、蚂蚁金服等科技公司都在采购华为的昇腾AI芯片。上述华为云高管直言,一些互联网云厂商训练AI大模型时,甚至都在用直接使用华为云的算力。一位国资背景大型企业集团数字化负责人去年11月曾对《财经十一人》表示,公司在大批采购昇腾芯片。昇腾供不应求,2023年11月价格甚至是过去的2倍以上。他们是重点客户,因此以优惠定价拿到了产品。昇腾等国产AI芯片最大问题是,软件生态和英伟达有巨大差距。这导致昇腾目前只做到了“能用”,还不算“好用”。一位科技公司技术人士对《财经十一人》表示,华为甚至为很多企业派出了驻厂工程师,专门解决昇腾的适配问题。一位华为人士表示,昇腾芯片想要从“能用变得好用”,最好是开放给包括阿里、腾讯、字节、百度在内的所有科技公司使用。但现实情况是,华为云和其他公司有竞争关系。科技公司普遍对华为存在忌惮心态。虽然不得不用,但又不愿把芯片命脉彻底交给华为。和其他公司建立信任关系是缩小芯片软件生态的关键。中国算力产业的共识是,美国制裁短期内会让中国算力产业遭遇痛苦,但现在已经别无选择。研发国产芯片,规模化采购,是解决问题的现实路径。国产AI芯片的强弱与否,将直接决定中国AI算力的技术上限和使用成本,也会影响大模型的落地进展。
算力正在被当成是国家竞争的关键因素。英伟达创始人黄仁勋甚至认为,“算力即权力”。中国政策部门越来越希望在算力市场贯彻产业政策。中国算力资源分散、利用效率不高。无论是企业还是政府,都希望解决这个问题。政策方希望建立一张覆盖全国的“算力网”,降低算力成本、提高利用效率、扩大使用规模。其中每个主体都能明确定位。比如,电信运营商负责修建网络通道、降低网络成本,算力服务商提供算力资源,中立机构负责调度、传输算力。一种仍在讨论阶段的设想是,算力市场是否要像电力市场一样输配分离。云厂商面对这种设想时,最直接的疑问是,云计算天然就是算力、调度合一,这种技术成熟高效。输配分离不符合市场供需现实。而且美国市场已有现成的解决方案,美国三家云厂商充分市场竞争,算力效率被提到了最高。一位国资背景咨询公司人士在讨论时认为,电力市场之所以能够做到输配分离,原因是行政意志主导,国有企业执行。算力市场逻辑不一样,因为大部分算力、数据掌握在民营企业手中。因此,只有市场化逻辑才能行得通。企业参与输配分离要能获利,这种设想才可以实际执行。一位曾参与信息产业政策研究制定工作的资深人士在2023年11月曾对《财经十一人》表示,中国算力利用低效的根源是市场碎片化严重。这个问题要解决,但有两个核心原则。一是,算力基础设施应该是市场主导,而非政府主导。二是,算力正在成为中美博弈的重点。决定胜负的核心因素是,规模、技术、生态、芯片。此时,应该做大平台企业,尽量给算力企业松绑,而非添加限制条件。中国算力市场,如何提高算力效率,一直是各方博弈的敏感点——阿里、华为、电信运营商乃至其他算力服务商,都有自己的主张。各个企业提出主张时,同样也夹杂商业利益。云计算厂商主张坚持公有云路线,通过市场竞争、技术竞赛角逐出类似于美国三大云厂商的市场格局。它们认为算力存在技术门槛,不应该像电力一样,被规划成标准化的资源,进而削弱自身技术优势。华为期望能够跟随政策方向出售更多芯片、网络设备,同时保持云业务的优势。华为在博弈中,左右皆可、长袖善舞。电信运营商希望借助网络、数据中心等优势以及国资背景夺取更大的市场份额。电信运营商不愿意随意降低网络成本,更不愿意为未知需求付出高昂的网络建设成本。算力显然已经不再是简单的商业、技术问题。提高算力产业整体竞争力是共识。这个目标的实现,将在各方博弈中前行。