【亿邦原创】2月18日,马斯克硬刚奥特曼,梁文锋PK杨植麟,大模型领域最顶尖的精英们同天在模型层放大招,决战AI之巅——“城头变幻大王旗”,谁也无法稳坐高台。
马斯克前脚宣布Grok3是“全球最聪明”,奥特曼后脚就发推“AGI初体验要来。”
2月18日,马斯克在直播间发布xAI公司新一代旗舰大模型Grok 3。2年内,xAI接连推出Grok系列模型:从3140亿参数的Grok-1,到多模态的Grok-1.5 Vision,到针对GPT 4o的Grok 2,到“最聪明”的Grok 3,马斯克一直以来都试图通过“大力出奇迹”的开源策略硬刚OpenAI的闭源壁垒。
Open AI CEO山姆·奥特曼也不示弱,在X平台透露,预计GPT-4.5会在一两周内发布,届时拿出满血的o3, 还将在未来几个月内推出GPT-5。“GPT-4.5将带来AGI的初体验。”
值得注意的是,尽管高举开源大旗,Grok 3目前仍是闭源大模型,马斯克表示,大概几个月后,等Grok 3成熟稳定,再开源Grok 2。
也是在2月18日,DeepSeek和月之暗面不约而同上传各自最新论文,主题均围绕如何优化Transformer架构中的注意力机制,试图在训练速度、反馈速度、超长上下文处理方面进一步降本增效,两位创始人名字赫然在列。
这不是DeepSeek和月之暗面第一次“撞车”,在DeepSeek R1发布即爆火的当天,月之暗面紧随其后发布K 1.5模型及技术报告,两款模型和两篇论文都指向强化推理方向,甚至都详细分享了如何训练一个强化推理模型。目前,宣布接入DeepSeek的模型厂商、云厂商、应用商已超过200家,而月之暗面与豆包成为仅剩的“异类”。
剧烈变动的技术生态不仅让从业者压力倍增,也让应用者无从下手。2月14日晚,亿邦动力马蹄社举办2025年第一场“马蹄友局”,主题为:AI来袭,品牌如何用它改变未来?十余位来自消费、科技、制造等领域的创始人及高管围炉夜话,叩问AI能力边界,深入技术与商业的本质。持续两小时的思维碰撞,没有标准答案,却清晰传递出一个信号:AI正在将商业拉入一个“量子态”——旧规则崩塌,新秩序未立。重要的是,要在技术洪流中捕捉转瞬即逝的确定性:比“如何用AI”更重要的,想清楚是“为何用AI”。
1、Grok3登顶“全球最聪明大模型”
北京时间2月18日午间,马斯克旗下xAI公司正式发布新一代大模型Grok 3,这也是他此前预告的“全球最聪明的大模型。”据介绍,Grok 3在AIME 2025科学推理测试中得分超过Gemini 2 Pro和GPT-4o,其迷你版模型甚至在编程任务中击败了DeepSeek-R1。 现场演示中,Grok 3仅用30秒便生成了一份从地球到火星的航天器轨迹图,并标注出引力弹弓效应的最佳利用节点。 在数学测试中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。
比Grok更引人注目的事x AI的算力集群。发布会上,xAI介绍:122天建成了10万显卡集群,再过了92天后,建成了20万张H100显卡集群。这是世界上最大的H100算力集群。 据悉在2024年底,xAI在田纳西州孟菲斯建成了一座堪比“算力核电站”的数据中心,10万块英伟达H100 GPU组成的集群,让Grok 3的训练速度比前代提升十倍。马斯克在推特上写:“算力即权力,而我们将拥有最暴力的武器。” 此后马斯克宣布融资60亿美元,继续投资Grok大模型的训练。
2、GPT-4.5即将到来,同时将带来AGI的初体验
Open AI山姆·奥特曼在X平台宣称:“GPT-4.5将带来AGI的初体验。”预计GPT-4.5也会在一两周内发布,届时拿出满血的o3。OpenAI还将在未来几个月内推出GPT-5。
3、杨植麟和梁文锋同天发论文,主题还撞了
2月18日,DeepSeek和月之暗面均在技术社区发布最新论文,DeepSeek的论文题为:《Native Sparse Attention:Hardware-Aligned and Natively Trainable Sparse Attention》,月之暗面的论文是《MoBA:MIXTURE OF BLOCK ATTENTION FOR LONG-CONTEXT LLMS》,主题都是优化Transformer架构中的注意力机制,高效处理长文本。
DeepSeek提出新架构NSA(原生稀疏注意力),月之暗面提出MoBA,均指向在全注意力和稀疏注意力机制之间自由切换,以克服Transformer架构本文越复杂,运算越缓慢,技术越卡的问题。
4、百度决定开源下一代文心大模型
2月14日,百度官网宣布,将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。在此之前的2月13日,百度刚宣布文心一言将于4月1日零时起全面免费。百度官网曾预告,ERNIE系列的下一代模型Ernie 5.0计划在2025年下半年发布,其将在模型多模态能力方面有重大增强。数据显示,截至2024年11月,文心一言用户规模为4.3亿,文心大模型日均调用量超过15亿次,较2023年增长超30倍。
5、零一万物商业化加速:苏州建基地 预备量产行业大模型
2月14日,零一万物与苏州高新区联合成立的产业大模型基地正式授牌。作为聚焦垂直产业的大模型基地,该基地将重点打造制造、金融、医疗、政务等多个领域的行业大模型解决方案,携手中细软集团、超媒体集团(原现代传播集团)、创新奇智、倍漾量化、呈元科技、穹彻科技、随锐科技等头部产业链伙伴,探索大模型技术从实验室走向生产线的产业化路径。
整体来看,零一万物产业大模型基地首批公布的行业解决方案展现出鲜明的产业特征——以行业融合应用为需求牵引,携手产业领军高新企业,把大模型“超级大脑”凝练为领域专家,从点到面深入加速苏州大模型生态发展,实现大模型智赋产业数智化转型升级,推动实体经济高质量增长。
6、百川智能打造的首个AI儿科医生,正式“上岗”
2月13日,国家儿童医学中心首都医科大学附属北京儿童医院开展了国内首次“AI儿科医生+多学科专家”的双医并行多学科会诊。这位AI儿科医生,由北京儿童医院与百川智能、小儿方健康科技联合研发,以Baichuan M1大模型为底座打造,于1月18日上线,在经过北京儿童医院近一个月的内测并得到专家的认可后,昨日正式“上岗”。
基于百川智能研发的Baichuan M1大模型,“AI儿科医生”整合了超过300位北京儿童医院知名儿科专家的临床经验和数十年的专家高质量病历数据,通过结构化临床推理范式训练,构建了覆盖儿童常见病与疑难病症的立体化知识体系。针对临床推理,它首先会基于一诉五史生成诊疗假设,继而通过检验检查数据进行假设证伪与排除,最终经由自反思机制对剩余假设进行概率排序,输出符合临床思维路径的诊疗建议。
7、国资委筹备组建国家数据集团
2月14日,国务院国资委(下称“国资委”)正在筹备组建一家新央企,这家企业的名称为国家数据集团。一名接近上述新央企筹备的人士表示,这一举措标志着中国在数据要素市场化改革中迈出关键一步,旨在进一步整合和优化全国数据资源,推动数据要素的高效配置与深度应用。 该集团将承担起整合、运营和开发国家级数据资源的重任,涵盖能源、交通、金融、医疗、工业等多个关键领域,推动数据资源的跨行业、跨区域流动与共享。
8、当AI成为品牌的“共生伙伴”:一场关于未来商业的思辨之旅
2月14日晚,亿邦动力马蹄社举办2025年第一场【马蹄友局】,主题为:AI来袭,品牌如何用它改变未来?十余位来自消费、科技、制造等领域的创始人及高管在线围坐,叩问AI能力边界,深入技术与商业的本质。
有快消品牌通过AI生成短视频,将单条成本从200元压缩至5分钟内的近乎零边际成本;有跨境商家用AI客服覆盖全球时区,旺季售后响应效率提升300%;甚至有企业尝试用AI替代月薪35万的市场总监,完成从数据分析到策略输出的全链条决策。
但效率的另一面,是技术对人性的挑战。当AI将电商运营水平拉升至同一基准线,企业被迫卷入更残酷的“无差别竞争”;而当员工依赖AI输出“80分方案”,人类创造力是否会被“平庸化”?
这场持续两小时的思维碰撞,没有标准答案,却清晰传递出一个信号:AI正在将商业拉入一个“量子态”——旧规则崩塌,新秩序未立。而马蹄友局的价值,恰在于聚集一群“清醒的冒险者”,在技术洪流中捕捉确定性:比“如何用AI”更重要的,是“为何用AI”。下一场马蹄友局,邀您共同定义未来。