3月1日,AI公司DeepSeek的五天“代码开源周”圆满结束。在这段时间里,DeepSeek每天都会不定时地开源一些代码库,这些库包括FlashMLA、DeepEP通信库、DeepGEMM、并行优化策略和并行文件系统3FS。
DeepSeek认为,通用人工智能(AGI)并非高高在上的存在,而是需要像车库创业一样,与社区共同构建创新力量。五天的代码开源,展示了DeepSeek在大模型训练、推理、通信和文件系统方面的技术创新和突破。这些开源项目不仅提升了AI模型的性能和效率,还为AI领域的研究者和开发者提供了宝贵的资源和工具。
DeepSeek通过自己的努力,从模型开源到代码开源,重塑了大模型世界。
与此同时,英伟达的股价却出现了下跌。尽管英伟达发布了最新财报,营收同比增长78%,但增速较之前有所放缓。分析师们认为,微软、Meta等核心客户研发自研芯片以减少对英伟达的依赖,以及DeepSeek-R1低成本AI模型降低算力需求,部分削弱了市场对英伟达高端芯片的依赖。
OpenAI最新发布的GPT-4.5模型也引起了关注。这款模型是OpenAI史上参数规模最大的模型,计算量是上一代的10倍,但API价格却上涨了30倍。然而,这款被网友吐槽“贵得要死”的大模型,并没有像以往那样引发热议。
以下是DeepSeek代码开源周的具体内容
- 2月24日开源了Flash MLA,这是一个针对英伟达Hopper GPU优化的高效MLA解码内核。
- 2月25日开源了DeepEP通信库,这是一个用于MoE模型训练和推理的EP通信库。
- 2月26日开源了DeepGEMM代码库,专为简洁高效的FP8通用矩阵乘法而设计。
- 2月27日开源了三项并行优化策略,包括DualPipe、EPLB和Profile-data。
- 2月28日开源了Fire-Flyer文件系统(3FS),一个高性能并行文件系统。
标题DeepSeek破局开源引领,创新力量点燃科技革命之火随着人工智能的迅猛发展,我们正经历着一场从“人教AI”到“AI教AI”的重大转变。在这个过程中,DeepSeek的成功无疑成为了这一转变的有力
标题AI问诊失误,汕大附院提醒用药诊断,专业医生才是关键随着科技的发展,人工智能(AI)在医疗领域的应用越来越普遍。AI问诊作为一种方便的医疗工具,为患者提供了快速、准确的诊断建议。但最近发生的一起A
3月29日,有消息传来,OpenAI即将完成一笔高达400亿美元的融资,但有一个前提条件必须在年底前成功转型为一家盈利性公司。如果OpenAI未能按时完成转型,软银可能会将融资规模缩减至200亿美元。
OpenAI最近推出了一款图像生成工具,迅速引发了网络上的吉卜力风格热潮。然而,在这场欢乐的背后,却隐藏着版权争议和意义的危机。这款名为“Images for ChatGPT”的工具一经推出,就迅速吸