DeepSeek开源周落幕,科技界迎来新风向标!

2025-03-02

3月1日,AI公司DeepSeek的五天“代码开源周”圆满结束。在这段时间里,DeepSeek每天都会不定时地开源一些代码库,涉及到的内容包括FlashMLA、DeepEP通信库、DeepGEMM、并行优化策略以及并行文件系统3FS。

DeepSeek认为,通用人工智能(AGI)不应该高高在上,而应该像车库创业一样,与社区共同构建创新力量。五天的代码开源,展示了DeepSeek在优化大模型训练、推理、通信以及文件系统方面的技术创新与突破。这些开源项目不仅提升了AI模型的性能和效率,还为AI领域的研究者和开发者提供了宝贵的资源和工具。

DeepSeek通过自己的努力,从模型开源到代码开源,重塑了大模型世界。

与此同时,英伟达的股价却出现了下跌。尽管英伟达发布了最新财报,营收同比增长78%,但增速较之前明显放缓。分析师们认为,微软、Meta等核心客户同步研发自研芯片以减少对英伟达的依赖,以及DeepSeek-R1低成本AI模型降低算力需求,部分削弱了市场对英伟达高端芯片的依赖。

OpenAI最新发布的GPT-4.5大模型也引起了争议。这款模型参数规模最大,计算量是上一代的10倍,但API价格却上涨了30倍。尽管如此,GPT-4.5并没有像之前的旗舰大模型那样引发热议。有网友表示,有了免费好用的DeepSeek开源,实在难以理解为何要花这么多钱使用OpenAI的产品。

以下是DeepSeek代码开源周的具体内容

- 2月24日开源Flash MLA,这是一个针对英伟达Hopper GPU优化的高效MLA解码内核。

- 2月25日开源DeepEP通信库,这是一个用于MoE模型训练和推理的EP通信库。

- 2月26日开源DeepGEMM代码库,专为简洁高效的FP8通用矩阵乘法而设计。

- 2月27日开源三项并行优化策略,包括DualPipe、EPLB和Profile-data。

- 2月28日开源Fire-Flyer文件系统(3FS),一个高性能并行文件系统。

标签:
流量卡