引言
长期以来,Anthropic 一直把自己定位为一家不想依赖单一路径硬件的公司。它的算力战略建立在 AWS Trainium、Google TPU 和 NVIDIA GPU 的组合之上。与纯粹优先选择 NVIDIA 的策略相比,这种多平台方案让 Claude 的开发商拥有更大的灵活性。
但最近的报道显示,Anthropic 现在可能正在考虑第四张牌:自研定制 AI 芯片。
根据原文,《The Information》报道称,Anthropic 已开始对定制 AI 芯片进行早期工作,并已与三星电子讨论潜在的制造选项。据报道,这些选项包括三星的 2nm 工艺和先进封装,两者都与现代 AI 加速器高度相关。

这并不意味着 Anthropic 已准备好取代现有的算力供应商。该项目仍被描述为处于早期阶段。芯片用途、目标性能、服务器集成以及集群部署计划尚未最终确定。不过,方向已经很清楚:随着前沿 AI 的训练和服务成本越来越高,最大的 AI 实验室正被更深地拉入硬件栈。
据报道 Anthropic 正在与三星洽谈定制 AI 芯片
这条核心报道很简单,但意义重大:据报道,Anthropic 已开始早期探索自研 AI 芯片,并已与三星就制造事宜进行了讨论。

据报道,讨论中的选项包括三星的 2nm 工艺和先进封装。在 AI 硬件领域,这两点非常重要。
更小的制程节点可以在相近的芯片面积内容纳更多晶体管,从而提升更高性能和更好能效的可能性。先进封装同样重要。现代 AI 芯片通常需要在计算单元和高带宽内存之间传输海量数据。数据路径越短、越快,芯片等待内存所浪费的时间就越少。
2024 年 7 月,三星宣布为 Preferred Networks 提供一套交钥匙半导体解决方案,将其 2nm GAA 工艺与 2.5D 封装结合在一起。原文指出,这可能正是 Anthropic 正在评估的制造与封装组合类型。

目前,这仍只是被报道出来的讨论,而不是 Anthropic 已确认的产品路线图。Anthropic 对外的公开立场仍然是,AWS Trainium、Google TPU 和 NVIDIA GPU 依旧是公司扩展算力的核心。
这也正是这件事有趣的地方。Anthropic 并不是一家没有算力合作伙伴的公司。它已经拥有多个合作伙伴。如果它仍在探索定制芯片,原因很可能不是短期替代,而是长期筹码。
两个信号:招聘与晶圆代工讨论
原文强调了两个使这则报道更具意义的动作。
第一个是招聘。据报道,Anthropic 引入了 Clive Chan,他是 OpenAI 定制芯片团队的早期成员之一。他还曾参与 Tesla 的 Dojo 超级计算机项目。这样的硬件人才招聘通常不会是偶然发生的。它表明公司想要建立内部能力,而不仅仅是获得外部供应商的支持。

第二个信号是据报道与三星进行的讨论本身。此前已有报道称,Anthropic 正在考虑将定制芯片作为应对算力短缺的一种方式。从“思考芯片”推进到“与潜在制造合作伙伴洽谈”,说明这一想法至少又向实际评估迈近了一步。
不过,从早期芯片项目到可部署的 AI 加速器之间仍有巨大差距。在一颗芯片能够在生产环境中发挥作用之前,公司必须定义工作负载、设计架构、验证硅片、确保封装。
容量、制造电路板和服务器、集成网络,并证明整个系统能够以集群规模运行。
这个过程需要时间,也需要大量资金。
计算账单逼出的第四张牌
要理解 Anthropic 为什么会考虑走这条路,首先要看计算问题的规模。
原文指出,Anthropic 的收入增长极快,而这种增长给基础设施带来了压力。使用 Claude 的客户越多,公司所需的训练和推理容量就越大。产品采用速度加快带来的不只是收入曲线,也会带来计算账单。
Anthropic 在 2026 年 4 月发布的官方公告称,公司已扩大与 Google 和 Broadcom 的合作,将获得多个吉瓦级的下一代 TPU 容量,预计从 2027 年开始上线。同一公告还表示,Anthropic 在 AWS Trainium、Google TPU 和 NVIDIA GPU 上运行 Claude,Amazon 仍是其主要云服务提供商和训练合作伙伴。

这一策略很容易理解:针对不同工作负载使用不同硬件平台,降低对单一供应商的依赖风险,并保持关键系统的韧性。
但在前沿规模下,即便是微小的效率提升也很重要。如果一个模型在数万枚加速器上进行训练或服务,几个百分点的提升就可能转化为非常可观的节省。电力、冷却、利用率、内存搬运、网络和空闲时间都会成为商业问题,而不只是工程问题。
这就是为什么即使自研芯片永远不会取代所有外部供应商,它也可能具有价值。
它给了 Anthropic 另一根杠杆。它可能降低特定工作负载的成本,可能提升其与云服务和芯片合作伙伴谈判时的议价能力,也可能让 Anthropic 围绕自身模型的实际运行方式来优化硬件,而不是让这些模型去适配现有的通用加速器。
从这个意义上说,据报道的芯片计划并不与 Anthropic 的多平台战略相矛盾。它可能是该战略的延伸。
OpenAI 已经走过这条路
原文将 Anthropic 据称所处的位置与 OpenAI 的自研硅芯片路径进行了比较。
OpenAI 在发布 Jalapeño 之前,就已经开始与 Broadcom 合作开发定制 AI 加速器。Jalapeño 是一款聚焦推理的 AI 芯片,围绕大型语言模型工作负载构建。OpenAI 的官方公告将 Jalapeño 描述为其首款 Intelligence Processor,也是其与 Broadcom 共同打造的多代计算平台的一部分。

这一比较之所以重要,是因为 OpenAI 在这条路上已经走得更远。该公司宣布与 Broadcom 开展 10 吉瓦规模的定制 AI 加速器合作,随后又将 Jalapeño 展示为一款专门为 LLM 推理设计的芯片。OpenAI 还表示,这款芯片从初始设计到流片仅用了九个月,部分得益于其自身模型的加速作用。
最后这一点尤其重要。AI 公司现在不只是购买芯片来运行 AI。它们开始使用 AI 来帮助设计未来运行 AI 系统的芯片。
这形成了一个飞轮。更好的模型有助于设计更好的基础设施。更好的基础设施会降低运行模型的成本和延迟。更低的成本让更多使用成为可能。更多使用带来更多数据、更多收入,也带来更大的压力去建设下一代基础设施。
与 Jalapeño 公开时的 OpenAI 相比,Anthropic 似乎还处在更早的阶段。根据原始报道,Anthropic 仍在定义这款芯片应该做什么,以及它将如何融入其余的计算栈。这是一条漫长道路的起点,而不是终点。
真的有人能挑战 NVIDIA 吗?
原文最后提出了 AI 基础设施领域最大的一个问题:定制芯片能否真正挑战 NVIDIA?
几分钟搭建展示站并增长获客
输入一句想法,We0 AI 即可生成展示站、页面与 CMS。发布上线后并帮你获取客户和流量。
答案比“能”或“不能”要复杂得多。
NVIDIA 仍然是 AI 加速领域的主导力量,尤其是因为它卖的不只是芯片。它销售的是一个成熟的平台:GPU、网络、软件、库、系统,以及开发者对其的熟悉度。对许多 AI 团队来说,NVIDIA 仍然是最快、风险最低的扩展方式。

这就是为什么不应把定制芯片简单看作是试图“干掉 NVIDIA”。对于 Google、Amazon 等公司来说,
微软、Meta、OpenAI,以及现在可能还有 Anthropic,它们的目的通常更加具体。
它们希望自身工作负载具备更好的经济性。它们希望对供应拥有更多控制权。它们希望拥有更强的议价能力。它们希望能够优化从模型架构、推理服务到数据中心设计的整个技术栈。
换句话说,定制芯片未必会在一夜之间接管 NVIDIA 的市场。但它们可以重塑那些以最大规模运营的公司的经济结构。
对 Anthropic 来说,定制芯片将是又一个长期选项。该公司可以继续使用 AWS Trainium、Google TPU 和 NVIDIA GPU,同时也发展内部芯片专业能力。如果项目成功,它将获得效率和杠杆优势。如果项目不成功,现有的多供应商策略仍能为 Anthropic 提供扩展空间。
这对 AI 基础设施竞赛意味着什么
AI 行业正在进入一个阶段:模型公司不再只是软件公司。领先实验室也正在成为基础设施公司。
在上一个时代,芯片制造商很大程度上定义了计算的形态,而软件公司则基于这些硬件构建应用。在 AI 时代,这种关系开始反转。构建前沿模型的公司越来越多地定义它们对芯片、内存、网络、电力、冷却和数据中心的需求。
据报道,Anthropic 与三星的谈判正符合这一更广泛的趋势。
该项目可能永远不会进入大规模量产。三星可能会成为制造合作伙伴,也可能不会。最终的芯片架构——如果确实存在——可能会与目前讨论的内容大不相同。但战略方向很清楚:前沿 AI 公司希望对智能背后的物理基础设施拥有更多控制权。
提供智能服务的成本越高,拥有更多技术栈环节的动机就越强。
来源说明
本文基于 BAAI / 新智元的原文及其列出的参考资料。有关 Anthropic 与三星讨论定制芯片的报道基于第三方报道,在 Anthropic 或三星正式宣布之前,应被视为一个早期、未经确认的硬件项目。
原文中未发现代码块、命令行步骤、配置文件或技术表格。原文包含若干平台标志、宣传图片、二维码/联系方式图片和装饰性横幅;这些内容已根据发布规则移除。BAAI 页面中的一张 OpenAI 相关原图无法稳定获取,因此改用相关 Jalapeño 公告中的 OpenAI 官方图片。
原始来源:https://hub.baai.ac.cn/view/56077
常见问题
据报道,Anthropic 在定制 AI 芯片方面有什么计划?
据报道,Anthropic 正在探索一个早期定制 AI 芯片项目,并已与三星讨论可能的制造选项。该芯片尚未被公开确认为最终产品,其设计目标仍不明确。
如果 Anthropic 已经使用 AWS Trainium、Google TPU 和 NVIDIA GPU,为什么还要打造自己的 AI 芯片?
定制芯片可以帮助 Anthropic 针对特定工作负载提升效率,并对成本和供应拥有更多控制权。它还可以让该公司在与主要云服务和芯片供应商合作时拥有更强的议价能力。
在这个语境下,三星 2nm 是什么意思?
三星 2nm 指的是一种先进的半导体制造工艺。从理论上讲,更先进的工艺可以支持密度更高、能效更好的芯片设计,不过实际性能取决于完整架构、封装、内存和系统设计。
为什么先进封装对 AI 芯片很重要?
AI 工作负载需要在处理器和内存之间移动海量数据。先进封装可以让计算单元和高带宽内存更靠近彼此,从而改善数据移动,并减少浪费的时间和功耗。
Anthropic 是想取代 NVIDIA 吗?
不一定。更现实的解读是,Anthropic 希望在其算力战略中拥有另一个选项。NVIDIA GPU 可能仍然很重要,而定制芯片则有助于处理目标工作负载、控制成本并提升供应链灵活性。
OpenAI 的 Jalapeño 芯片与这个故事有什么关系?
OpenAI 的 Jalapeño 展示了一家大型 AI 实验室如何更深入地进入面向推理工作负载的定制芯片领域。这个比较很重要,因为 Anthropic 现在可能正在开启类似旅程,尽管它似乎还处于更早期阶段。
Anthropic 的芯片已经准备好投产了吗?
没有公开证据表明 Anthropic 已拥有一款可量产芯片。根据原始报道,该项目仍处于早期阶段,关键设计和部署决策尚未最终确定。
相关工具
- Anthropic:Claude 背后的 AI 公司,据报道正在探索定制芯片。
- AWS Trainium:亚马逊专为训练和推理工作负载打造的 AI 加速器系列。
- Google Cloud TPU:谷歌面向大规模 AI 训练和推理的张量处理单元平台。
- Samsung Foundry:三星的半导体制造业务,包括先进制程和封装服务。
- Broadcom:一家
参与定制 AI 加速器基础设施的半导体和网络公司。
- OpenAI:与博通共同发布 Jalapeño 推理芯片的 AI 公司。
相关链接
- BAAI 原文:用于此次英文改写的源文章。
- The Information:Anthropic 正与三星洽谈:源文章引用的原始付费报道。
- Anthropic、Google 与博通的计算合作:Anthropic 关于多吉瓦级下一代 TPU 容量的官方公告。
- 三星 2nm GAA 与 2.5D 封装公告:三星官方新闻中心关于为 Preferred Networks 提供 2nm GAA 与 2.5D 封装的文章。
- OpenAI 与博通 Jalapeño 推理芯片:OpenAI 关于其面向 LLM 优化的推理芯片的官方公告。
- 博通与 OpenAI 10GW 合作:博通关于 OpenAI 定制加速器合作的官方投资者公告。
- AWS Trainium 概览:AWS 关于 Trainium AI 芯片的文档和产品概览。
- Google Cloud TPU 文档:Google Cloud TPU 架构与使用的官方文档。
总结
据报道,Anthropic 正在探索定制 AI 芯片,并已与三星讨论可能的制造方案,包括先进的 2nm 制程和封装技术。该项目似乎仍处于早期阶段,但它契合了 AI 基础设施领域更广泛的转变:模型公司越来越希望对支撑其系统的硬件拥有更多控制权。
这一举动并不一定意味着 Anthropic 正在放弃 AWS Trainium、Google TPU 或 NVIDIA GPU。相反,它指向的是一种更长期的战略:使用多条计算路径,降低供应风险,并在前沿规模上提高成本效率。
OpenAI 的 Jalapeño 芯片表明,定制芯片正在成为前沿 AI 战略手册的一部分。Anthropic 现在可能也正在沿着类似道路迈出第一步。
关键点是:定制 AI 芯片不再只是硬件公司的故事;它们正成为最大型 AI 实验室的核心战略。



