华为昇腾连夜适配千问3

在阿里通义千问模型Qwen3(简称千问3)模型开源数小时后,华为官方宣布昇腾支持千问3全系列模型部署,开发者在MindSpeed和MindIE中开箱即用,实现千问3的0Day适配。

据悉,千问3是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。华为官方表示,千问3的旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比,表现出极具竞争力的结果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,甚至像 Qwen3-4B 这样的小模型也能匹敌 Qwen2.5-72B-Instruct 的性能。

此前华为昇腾就一直同步支持千问系列模型。昇腾MindSpeed训练、MindIE推理支持千问2.5、兼容主流生态的分布式并行接口等,千问3系列模型一发布即实现低代码无缝迁移。

打开APP阅读更多精彩内容