据《新华日报》与《科创板日报》报道,安徽省量子计算工程研究中心透露,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在我国第三代自主超导量子计算机 “本源悟空” 真机上,成功完成全球首次十亿参数 AI 大模型微调任务。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀指出,这是量子计算首次 “真机实战” 大模型任务,意味着现有硬件已初步具备支撑大模型微调的能力。
实验数据显示,在参数量减少 76% 的情况下,训练效果反而提升了 8.4%。这一成果不仅验证了量子计算助力大模型轻量化的可行性,更为解决大模型面临的 “算力焦虑” 问题开拓了新途径。
微调是基于通用大模型(如 DeepSeek、Qwen),通过对特定领域数据的进一步训练,使其适配医疗诊断、金融风控等专业场景。传统低秩微调存在性能瓶颈、泛化能力不足等难题,而量子计算利用其叠加态和纠缠态特性,能够同时探索海量参数组合,有效提升大模型微调效率。本源量子副总裁窦猛汉形象地比喻,这如同给经典模型装上 “量子引擎”,实现两者协同。团队创新性设计了 “量子加权张量混合参数微调”,将模型权重转化为量子神经网络与张量网络混合架构,前者借助量子门操作提取高维非线性特征,后者则用于压缩参数规模。
在 “本源悟空” 的量子芯片上,单批次数据可生成数百个量子任务并行处理。实验表明,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低 15%,数学推理任务(R1-Distill-SFT)的严格准确率从 68% 提升至 82% 。陈昭昀再次强调,此次成果证实了现有硬件对大模型微调的初步支撑能力。
公开资料显示,“本源悟空” 作为我国第三代自主超导量子计算机,搭载 72 位自主超导量子芯片 “悟空芯”,是当前先进的可编程、可交付超导量子计算机。其命名灵感来源于神通广大、会七十二变的神话人物孙悟空。2024 年 1 月 6 日 9 时,“本源悟空” 在本源量子计算科技(合肥)股份有限公司上线运行。今年 2 月 14 日,该计算机全球访问量突破 2000 万次,刷新我国自主量子算力服务规模纪录。