DeepSeek开源周落幕,共创未来,世界因你而不同!

2025-03-02

3月1日,AI公司DeepSeek的五天“代码开源周”圆满结束。在这段时间里,DeepSeek每天都会不定时地开源一些代码库,这些库包括FlashMLA、DeepEP通信库、DeepGEMM、并行优化策略和并行文件系统3FS。

DeepSeek认为,通用人工智能(AGI)并非高高在上的存在,而是需要像车库创业一样,与社区共同构建创新力量。五天的代码开源,展示了DeepSeek在大模型训练、推理、通信和文件系统方面的技术创新和突破。这些开源项目不仅提升了AI模型的性能和效率,还为AI领域的研究者和开发者提供了宝贵的资源和工具。

DeepSeek通过自己的努力,从模型开源到代码开源,重塑了大模型世界。

与此同时,英伟达的股价却出现了下跌。尽管英伟达发布了最新财报,营收同比增长78%,但增速较之前有所放缓。分析师们认为,微软、Meta等核心客户研发自研芯片以减少对英伟达的依赖,以及DeepSeek-R1低成本AI模型降低算力需求,部分削弱了市场对英伟达高端芯片的依赖。

OpenAI最新发布的GPT-4.5模型也引起了关注。这款模型是OpenAI史上参数规模最大的模型,计算量是上一代的10倍,但API价格却上涨了30倍。然而,这款被网友吐槽“贵得要死”的大模型,并没有像以往那样引发热议。

以下是DeepSeek代码开源周的具体内容

- 2月24日开源了Flash MLA,这是一个针对英伟达Hopper GPU优化的高效MLA解码内核。

- 2月25日开源了DeepEP通信库,这是一个用于MoE模型训练和推理的EP通信库。

- 2月26日开源了DeepGEMM代码库,专为简洁高效的FP8通用矩阵乘法而设计。

- 2月27日开源了三项并行优化策略,包括DualPipe、EPLB和Profile-data。

- 2月28日开源了Fire-Flyer文件系统(3FS),一个高性能并行文件系统。

标签:
流量卡