极客网·人工智能报道,3月26日,中国的人工智能领域再次向全球开源社区展示了新的成就。阿里通义千问和DeepSeek这两家公司都低调地开源了新的模型。阿里推出了适合本地部署的高性能多模态模型Qwen2.5-VL-32B,而DeepSeek则更新了其热门的基座模型V3至0324版本,并在魔搭社区上架开源。目前,魔搭社区已经成为中国最大的AI开源社区,模型总数已经超过了4万个。
千问Qwen-VL是全球AI开源社区中颇受欢迎的多模态模型之一。此前,通义千问Qwen2.5-VL已经开源了3B、7B及72B等不同尺寸的版本,最近又推出了更适合本地部署的32B版本。Qwen2.5-VL-32B在多个基准测试中表现出色,其性能超过了更大规模的Qwen2-VL-72B和GPT-4o-0513,甚至优于Mistral-Small-3.1-24B、Gemma-3-27B-IT等近期热门模型。在Hacker News等知名网站上,Qwen2.5-VL-32B的热度非常高,成为了当天讨论最多的新闻。
DeepSeek-V3是全球备受关注的基座大模型之一,最近也完成了小版本的升级。DeepSeek透露,新版的V3-0324模型采用了R1模型训练过程中的强化学习技术,显著提升了推理类任务的表现,在数学、代码等评测集上取得了超过GPT-4.5的得分,同时在前端开发、中文写作、中文搜索等方面也有所提升。V3-0324模型在HuggingFace开源后迅速登上趋势榜榜首。DeepSeek还在官方推文中首次宣布在魔搭社区开源,旨在更好地服务中国开发者和企业。
魔搭社区,由阿里云和CCF开源发展委员会共同牵头组建,已发展成为中国最大的AI开源社区。该社区秉承“模型即服务”(MaaS,Model as a Service)的理念,为AI开发者提供了一站式的模型体验、下载、调优、训练、推理和部署等服务。在魔搭社区,开发者可以轻松找到并使用各种大模型。截至目前,包括阿里通义千问、DeepSeek、阶跃星辰、MiniMax、月之暗面、百川智能、零一万物、智谱AI等在内的知名大模型公司都在魔搭社区开源了最新的模型。魔搭社区已经覆盖了LLM、对话、语音、文生图、图生视频、AI作曲等多个领域,为超过1000万开发者提供服务。
8月2日凌晨,国际知名的大模型评测平台Chatbot Arena发布了新一期的大模型排行榜。在这份榜单中,最近公开的阿里千问3新模型取得了1433分的高分,超过了Grok4和Claude4等顶级闭源模
在当前全球数字化浪潮的推动下,企业对于高效、智能的数字化解决方案的需求日益增长。5月27日,阿里巴巴集团与SAP宣布建立战略合作伙伴关系,这一强有力的合作举措,将为企业的数字化转型注入新的活力。这次合
极客网·人工智能4月30日报道,近日,阿里巴巴公司正式发布了全新的开源模型——Qwen3(千问3)。作为中国首个混合推理模型,Qwen3将快速思考和深度思考相结合,既能迅速响应简单需求,也能在处理复杂
4月29日凌晨,阿里巴巴发布了新一代的通义千问模型Qwen3,简称千问3。这个模型参数量只有DeepSeek-R1的1/3,大大降低了成本,同时性能全面超越了R1、OpenAI-o1等全球顶尖模型,成