字节跳动打造自主AI GPU,助力降低对英伟达的依赖程度

2025-03-02

据新闻报道,字节跳动正在研发两款针对人工智能领域的GPU,并计划在2026年实现大规模生产。这两款GPU将由台积电制造,这不仅能减少字节跳动对英伟达的依赖,还符合美国的出口管制规定。

目前,这两款GPU还在设计阶段,一款是针对AI训练的,另一款则是用于AI推理。预计它们将使用台积电的先进制程技术N4或N5进行生产,与英伟达的Blackwell系列制程技术相仿。字节跳动希望能在2026年实现这些GPU的大规模生产和应用。

今年,字节跳动投入了超过20亿美元购买了超过20万台英伟达H20 GPU,每台价格大约是一万美元,但其中许多订单尚未交付。由于市场上英伟达GPU供应紧张且价格昂贵,字节跳动决定自主研发人工智能硬件。

为了应对美国去年实施的出口管制政策,英伟达为中国市场特别设计了DGX H20等产品。尽管HGX H20的性能相比英伟达的高端H100有所降低,但它仍然配备了96GB的HBM3内存、最高4TB/s的内存带宽和8路GPU互联能力,因此在实际应用中仍然受到企业客户的欢迎。尽管字节跳动的新GPU可能会受到美国出口管制的限制,无法在性能上超越HGX H20,但其成本将大幅降低。

字节跳动在自主开发AI GPU方面面临的最大挑战是,公司目前依赖于英伟达的CUDA及相应软件栈进行AI训练和推理。如果转向自家GPU,字节跳动将需要开发新的软件平台,并确保软件与硬件的兼容性。

流量卡