这里是AI贴吧网-AI资讯的硬核前线!我们24小时监测全球实验室动态,算法追踪巨头动向、代码解析学术突破,用最“硅基”视角解秘AI革命浪潮!
阿里通义千问开源负责人林俊旸在X上发文暗示,Qwen3模型有望今日发布。
值得一提的是,Qwen3系列模型合集已在阿里巴巴旗下AI模型开源社区ModelScope(魔搭)短暂亮相后又下线,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型。所有模型均采用ApacheLicense2.0开源协议。尽管官方尚未发布正式公告,但结合命名规则与前代技术逻辑,可推测其技术路径与定位方向。
此次发布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B以参数规模直接命名,分别对应40亿、17亿和6亿参数。此类无后缀的命名方式或表明其为单架构稠密模型,未采用混合专家(MoE)设计,推测主打轻量化应用场景。而Qwen3-30B-A3B-Base为MoE架构基础模型,总参数300亿(30B)中动态调用30亿(3B)参数处理任务。
据1AI了解,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。
想掌握最新AI隐藏技能?挖透巨头紧急下架产品的真相?点击【AI贴吧网-AI资讯】,深度解析+实战案例,智能刷新你的认知!