2025年阿里巴巴在人工智能芯片领域动作频频。从自主研发的平头哥并行处理单元(PPU)正式落地,到以RISC-V为核心的长期架构规划,再到与中国联通的深度合作和与英伟达在物理AI层面的意外携手,阿里正在以“两条线”的方式推进其在AI产业链的布局。
通过孵化与自研建立国产算力的根基,试图摆脱对海外供应链的依赖;依靠加大资本开支提升云计算和AI服务的整体竞争力,阿里在未来十年内构建算力自给体系的主动谋划。
Part 1
孵化与自研:
从含光800到PPU
阿里在芯片领域的探索并非始于今日。2018年,因中兴事件暴露了国内在芯片上的脆弱性,阿里成立了平头哥半导体,作为其芯片研发的核心平台。2019年,首款推理芯片含光800问世,主要应用于阿里内部数据中心。那一阶段的芯片开发更多是为了验证能力和满足自身需求,并未承担外部市场化任务。
真正的转折点出现在2025年。阿里发布了全新的平头哥PPU,这是一款面向大规模AI推理的专用加速器。其设计逻辑并非简单追赶,而是直指英伟达在中国市场的留白区域。
在美国出口管制的限制下,H100、A100等先进芯片无法进入中国,H20成为可供选择的最高端产品。
阿里PPU在规格上对标H20,例如配备96GB HBM2e显存,互连带宽达到700GB/s,功耗控制在400W,性能已达到中国市场的最高合规水平。与A800相比,PPU在内存和互连方面更具优势。
PPU的生产完全由国内完成,据业内消息,芯片采用中芯国际的7nm工艺,整个制造链条高度本地化,在供应可控性上,阿里实现了从设计到制造的闭环,这种能力是战略性的突破。
在成本维度上,阿里也展现了工程化的思路。PPU的物料清单成本比H20低约40%,从而使阿里云能够将AI推理服务的价格降低一半。通过硬件到服务的联动,阿里不仅控制了算力成本,还迅速形成了市场价格优势。这是自研芯片与云业务一体化的直接收益。
阿里并未在软件生态上贸然切割,而是采取兼容策略。PPU支持CUDA相关框架,使得客户迁移成本最低。这种务实的兼容路线,既降低了推广阻力,也体现出自研芯片要真正融入市场的现实考量。