在人工智能引领的新一轮科技普惠进程中,科技平权成为世界各国,尤其是发展中国家从这一浪潮中获益的关键所在。中国在第78届联合国大会积极倡导“2030 年可持续发展议程”,旨在助力全球各国缩小数字差距,加强人工智能治理,推动数据、算法、算力领域的跨国合作,进而共享人工智能发展成果。在此背景下,摩尔线程作为国内人工智能产业的重要参与者,积极响应国家战略,投身到推动人工智能技术进步与产业发展的实践中。
中国在人工智能领域一向倡导全球化“共商共建共享”原则。为了弥补AI时代的数字鸿沟,中国积极出台产业政策,大力扶持本土大模型、数据、算力产业发展。作为人工智能发展的基础设施和技术瓶颈,我国尤其重视建设先进的芯片和算力集群。
政策方面,2024年的《政府工作报告》首次提出“人工智能+”行动,打造具有国际竞争力的数字产业集群。“人工智能+”上升为一种行动,意味着我国正加强顶层设计,加快形成以人工智能为引擎的新质生产力。今年7月工业和信息化部、中央网信办、国家发展改革委、国家标准委等四部门联合印发《国家人工智能产业综合标准化体系建设指南(2024版)》,树立了算力集群的技术“国标”,精确到智算中心、基础网络通信、算力网络、数据存储等基础设施的技术要求和评估方法。
在产业政策的激励下,以摩尔线程为代表的国产GPU算力已实现千卡、万卡集群的落地,取得里程碑式的进展。其中,夸娥千卡中心是国内首个以国产全功能GPU为底座的大规模算力集群;夸娥万卡集群则支持万卡、万亿参数、万P级浮点运算,为复杂大模型训练而设计。早在1月28日,已有B站UP主在MTT S80上手动完成相关实践。
通过DeepSeek提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产GPU上实现高性能推理。摩尔线程基于自研全功能GPU,通过开源与自研双引擎方案,快速实现了对DeepSeek蒸馏模型的推理服务部署。一方面,基于Ollama开源框架,摩尔线程完成DeepSeek-R1-Distill-Qwen-7B蒸馏模型的部署,验证了自研全功能GPU的通用性与CUDA兼容性;另一方面,通过自主研发的高性能推理引擎,结合软硬件协同优化技术,显著提升了模型的计算效率和资源利用率。
夸娥千卡和万卡集群的落地,树立了国产GPU技术的新标杆,有助于实现国产智算集群计算能力的全新跨越,将为我国人工智能领域技术与应用创新、科研攻坚和产业升级提供坚实可靠的关键基础设施。同时,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署,确保大规模模型的高效稳定运行,助力开发者快速实现业务落地。
当前,我们正处在生成式人工智能的黄金时代,技术交织催动智能涌现,GPU成为加速新技术浪潮来临的创新引擎。摩尔线程矢志投身于这一历史性的创造进程,致力于向全球提供加速计算的基础设施和一站式解决方案,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。夸娥万卡智算集群作为摩尔线程全栈AI战略的一块重要拼图,可为各行各业数智化转型提供澎湃算力,不仅有力彰显了摩尔线程在技术创新和工程实践上的实力,更将成为推动AI产业发展的新起点。
随着摩尔线程夸娥千卡和万卡集群的成功落地,中国算力在人工智能领域取得进展。这一成果不仅为国内人工智能技术创新、科研项目攻坚以及产业转型升级提供了支撑,也对推动全球可持续发展、增进全人类福祉具有积极意义。
(免责声明:此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。)