DeekSeek带火的不仅是大模型应用市场,也带火了硬件设备,在过去的一个多月时间里,受到DeepSeek的影响,一体机市场迎来爆发。一家业内主流服务器厂商相关负责人向钛媒体APP表示,DeepSeek-R1发布并宣布开源的一个多月来,该品牌的一体机询价量过万,为客户制定解决方案量达1000余个,已经落地部署用户量超过100个,部署量比去年显著提升,目前所有现货均已售出。
据浙商证券测算,预期DeepSeek快速部署需求有望带动一体机需求增长,2025年到2027年一体机需求量将分别达到15万台、39万台、72万台,对应市场空间分别为1236亿元、2937亿元、5208亿元。
大模型带火的一体机,DeepSeek又填了一把“柴”
一体机的概念早在大模型问世以前就有,不过彼时的一体机是一个非常小众的概念,且在大模型之前,一体机的概念更多的是一家集成商,通过集成各家的产品,为用户提供一个一站式的偏向于硬件层面的解决方案。
但随着大模型的问世,企业侧也开始探索AI能为企业业务做出哪些赋能。在这个过程中,企业出于安全性的考虑,更愿意选择在本地部署大模型,利用模型厂商训练好的基础模型,在本地通过私域数据的微淘,进而赋能业务。另一方面,又出于成本的考虑,在模型赋能业务量没有快速增长起来的初期阶段,企业自建数据中心,或者大量租赁数据中心显然达不到很好的ROI,而这时候,大模型一体机就成为了绝大多数企业部署大模型的首选。
而当DeepSeek带来更强大的算法优化及开源的态度之后,企业在本地化部署大模型的硬件所需成本被降的更低,以DeepSeek最近开源的FlashMLA为例,其专为英伟达Hopper GPU(如H800)设计,通过优化可变长度序列处理,实现了内存带宽3000 GB/s和浮点算力580 TFLOPS的极限性能,接近H800的理论峰值,也就是说,通过FlashMLA,用户可以将H800的性能做到英伟达官方给出性能的2~3倍,从而使用H800就能达到H100的性能(官方数据H100性能约为H800的2倍),在实时生成任务的效率的同时,FlashMLA还能降低部署大模型部署成本,从而进一步降低大模型应用的门槛,推动大模型在各行各业中的落地。
DeepSeek的开源“风暴”进一步引爆一体机市场。神州数码信创业务集团副总裁、研发中心总经理周川通过神州数码对于海量用户的询问和方案分析总结出,现阶段,企业在应用大模型的过程中,相比于使用云服务和API调用的方式,企业更愿意采用私有化部署的方式来应用大模型,“而现有一体机实现了全新的算力或AI能力的付费模式,模型基本无需额外大笔花费,只需支付一年的使用费用,这避免了高额成本。”周川指出。
不仅于此,北京格灵深瞳信息技术股份有限公司产品总监陈天博告诉钛媒体APP,大模型一体机的快速发展,让模型应用从“通用模型+固定硬件”转向“开源底座+场景定制”,通过软硬件协同降低专用化成本,同时保留大模型的泛化能力,推动AI从技术试验走向规模化落地。
以神州数码旗下神州鲲泰最新发布的神州鲲泰问学一体机DeepSeek版为例,基于DeepSeek开源模型,神州鲲泰问学一体机推出了涵盖满血版、蒸馏标准版,以及蒸馏轻量版等适用于不同规模企业不同需求的配置版本。据周川介绍,该产品可提供基于鲲鹏、昇腾的全栈适配服务,可通过配置算力优化模组,促使算力成本直降30%。
一体机的火爆并不是供应商单方面的狂欢,市场对于一体机给出反馈也是异常火爆,青云科技副总裁,沈鸥告诉钛媒体APP,从青云客户反馈以及收到的咨询情况来看,企业级客户对于国产化、开箱即用的需求确实处于增长时期,随着产业生态合作的逐步深入,一体机也能够在不同场景上提供更高的业务价值。
无独有偶,优刻得新兴产业事业部首席架构师李天朋也向钛媒体APP表示,自从DeepSeek宣布开源以后,一体机的咨询量就大幅上升,“目前来看,一体机的主要用户群体集中在金融、教育、医疗、政府等对数据安全等级要求比较高的传统行业,以及对时延要求极高的工业领域。”李天朋进一步指出:“相对来说,一体机的市场还是比较小众,DeepSeek的出现并没有促使互联网企业、尤其是大厂选择一体机产品。”
性价比依旧是普及的门槛
与市场的火爆相对的,被大模型真正带火的一体机目前技术仍处于快速迭代的时期。
DeepSeek开源大模型的崛起彻底改变行业逻辑。硬件厂商与软件生态解耦,形成“开源模型+标准化硬件”的新模式。浪潮信息、神州数码、联想等为代表的硬件厂商,以及优刻得、青云科技等为代表的云服务商在内的60余家企业基于DeepSeek推出训推一体机,价格下探至数十万元级别,同时支持本地化部署,满足政企数据安全需求。这一阶段,一体机从“工具属性”转向“生态入口”,成为AI普惠化的重要载体。
浪潮信息产品方案开发部总经理魏健告诉钛媒体APP,得益于DeepSeek在架构和算法上的创新,一体机对于算力(芯片)的要求显著降低,“Deepseek采用FP8混合精度加速训练,显著提升计算速度,同时减少 GPU内存占用,浪潮信息的元脑企智Deepseek一体机具备高算力、大显存优势,单台设备支持部署DeepSeek V3/R1全参数版本(最高达671B参数),可以充分满足千人以上规模企业的使用需求。”魏健如是说。
同时,这也推动了芯片行业的优化,此前,英特尔数据中心与AI集团副总裁兼中国区总经理陈葆立告诉钛媒体APP,针对不同的创新的大模型版本,以芯片为代表的硬件设备也需要始终保持创新的姿态,以最高的性价比提供硬件支持,是未来的主流趋势。
性价比显然已经是当下企业选择数字技术的关键考量点,一体机之所以目前还是主要集中在一些特定场景中,而并没有更大的规模的普及开,主要还是因为规模化铺开的话其硬件成本相对较高。
据了解一台支持满血版DeepSeek-R1 671B模型的一体机售价上百万,甚至有可能达到200万以上,而最便宜的也要几十万,对此,李天朋告诉钛媒体APP,相较于API调用或者租用公有云的方式来看,目前一体机的硬件成本确实很高,对于互联网厂商这种大规模应用的行业来说,性价比低,只是适合部分诸如金融、医疗、工业等对时延和数据安全要求极高,且业务规模相对较小的用户。
但从目前一体机用户选择版本上看,咨询量最大的还是支持DeepSeek-R1/V3满血版的一体机产品,“绝大多数用户咨询的都是满血版的一体机,即便这些用户的业务可能蒸馏版的一体机就已经能满足,但是用户一开始是不清楚的。”李天朋进一步指出,“作为技术团队,优刻得会评估客户需求和使用场景,推荐最适配的模型。例如,企业内部智能问答场景,32b、70b 等蒸馏版模型就能满足需求,且响应速度更快,综合使用体验更好。同时,一体机中会预装满血版、蒸馏版及国内优秀开源模型,用户可通过模型市场功能添加新模型,进行模型替换。”
据李天朋介绍,目前优刻得的用户选择满血版与蒸馏版的占比几乎为一半一半。
硬件成本的要求,一方面需要硬件厂商研发更具性价比的硬件,另一方面,也需要通过标准化等手段,联合产业上下游,共同降低硬件成本。
除此之外,魏健还告诉钛媒体APP,尽管一体机降低了使用门槛,但硬件适配、算法优化等仍需较高技术投入,中小企业初期部署成本仍存压力,而这也将成为一体机未来优化的方向之一。
一体机还能火多久?
一体机到底会是“昙花一现”,还是会“持续长虹”?魏健对2025年一体机市场持有乐观态度,她表示,2025年大模型一体机市场将呈现爆发式增长,核心驱动力来自数据安全需求、技术迭代及本地化智能应用的加速拓展。但是也带来了市场竞争的进一步加剧,未来竞争将围绕场景适配性、成本控制及差异化服务展开,具备垂直领域深耕能力的企业或占据先机。
周川也曾告诉钛媒体APP,随着DeepSeek的出现,加速了本来就蓄势待发的推理市场的爆发,也会有更合适的应用场景落地,而这些场景也必将推动一体机市场的持续增长。
另一方面,从现有数据分析,至少在短期内,一体机市场的火爆态势还将持续。除了主观需求以外,也不容忽视B端客户IT投资规模累年上升的客观趋势。
以政务、金融IT领域AI+市场为例,据IDC数据,2024年中国数字政府IT投资规模达1583亿元,到2028年将达到2134亿元,CAGR达9.4%。其中基础架构层、平台层和应用解决方案领域投资占比最高。与此同时,2024上半年,中国金融整体基础设施市场规模为28.9亿美元,同比增速7.1%,市场环比增速初步回暖。
从本文多家涉及一体机的服务商的反馈可以了解到,金融行业显然是目前一体机最为主要的市场之一,以浪潮信息为例,在金融行业中,浪潮信息通过元脑企智Deepseek一体机融合DeepSeek大模型,充分发挥DeepSeek大模型长文本、代码、数 学、百科、中文能力,为银行、保险、 资管、投顾等在内的金融业务带来“迭代式”的场景变革,催生“AI+客服”“AI+ 运营”“AI+产品”“AI+资管”“AI+投研”“AI+合规”等创新商业模式,从而推动“人工智能+”在金融行业的落地。
而金融行业也必将成为接下来众多一体机供应商着重抢占的市场之一。
值得注意的是,大模型一体机还将带动国产化硬件市场,以及整个算力生态的发展。对此,陈天博表示,国产化也会成为一体机市场比较大的一个增量空间。应用场景也会更加多元,从政务、金融到医疗、能源,一体机覆盖的场景会不断扩展。“行业竞争格局也会发生变化,AI厂商、服务器厂商及电信运营商纷纷入局,逐渐形成‘硬件+算法+生态’的整合模式。”陈天博指出。
从技术发展角度出发,多位业内专家都向钛媒体APP表示,未来一体机市场重要的两个“卷”的方向是:部署成本和行业Know How。对于当前六十余家推出一体机的厂商而言,将走出完全不同的两条路:硬件厂商在硬件建设成本、适配优化和国产化适配等方面有着得天独厚的优势,也将成为设备厂商着重发力的方向;云服务商/算力服务商在端到端交付、前期客户对接测试、模型管理和算力调度,以及后续大模型与用户的深度融合等大模型全链路软件和服务等方面更具优势。(作者|张申宇,编辑丨盖虹达)