【文/观察者网 阮佳琪】
在美国不断加码遏制中国先进技术发展之际,中国人工智能公司深度求索(DeepSeek)推出大模型DeepSeek-R1,用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。这一成果持续震撼业界。
英国《每日电讯报》27日发文称,在上周20日举行的总统就职典礼上,特朗普将美国成为“世界人工智能之都”的雄心作为其讲话的核心要点,在国会大厦的前排还给开发人工智能的科技富翁们留出了最佳观赏位置。但就在同一天,DeepSeek悄无声息推出的新模型“杀疯了”。
英媒称,这款模型出人意料地缩小了中国与美国在人工智能领域的差距,无疑是公开挫败了美国政府长期以来妄图扼杀中国创新的阴谋。文章直言,“中国的人工智能模型羞辱了美国”。
DeepSeek已在苹果App Store美区免费榜登顶。
据《每日电讯报》报道,DeepSeek宣称仅仅耗费两个月的时间,不到600万美元的资金,以及2048块英伟达H800芯片,就成功打造出了这款超越众多西方竞争对手的先进模型。
相比之下,扎克伯格的Meta在构建Llama 3.1模型时,使用了1.6万颗英伟达H100芯片。而亚马逊支持的人工智能开发商Anthropic预估称,在2024年建立一个前沿模型的成本为10亿美元,下一代模型的成本更接近100亿美元。
在性能表现方面,DeepSeek同样令人瞩目。在准确性、编码和复杂问题解决等一些基准测试中,其表现不仅要优于Meta和Anthropic的模型,更比肩美国OpenAI o1正式版。
此外,英媒还特别提到,为促进技术社区的充分交流与创新协作,这家中国公司还公开了DeepSeek-R1训练技术,而不是将其作为知识产权加以保护。
报道称,这一举措在业界引发了强烈反响,重新点燃了人工智能开发人员的热情,“让硅谷既兴奋又焦虑”。英伟达的高级研究科学家吉姆·范(Jim Fan)对此高度赞扬道,“这是真正开放、赋能所有人的前沿研究,一家非美国公司正在让OpenAI的最初使命得以延续。”
数字新闻杂志“The Wire China”早前发文指出,DeepSeek对开源承诺的坚持与OpenAI的专有策略形成鲜明对比:DeepSeek允许全球企业和开发者共同开发和改进技术,OpenAI则限制对其系统的访问以维护竞争优势。
DeepSeek-R1、OpenAI-o1-1217和DeepSeek-V3的性能比较。DeepSeek微信公众号
“尽管美国两党长期以来一直处心积虑地试图扼杀中国人工智能领域的进步,但DeepSeek仍然诞生了。”“政客新闻网”注意到,在技术和商业影响之余,这也给华盛顿拉响了“政策警报”。
报道指出,DeepSeek的成功似乎确实挑战了这样一种信念,即“美国人工智能的未来需要更多的芯片和能力”,这会让特朗普在美国迅速建设此类基础设施的兴趣变得复杂起来。
“如果DeepSeek声称只花费560万美元和二流英伟达芯片就能训练其最新模型,那么为什么要向特朗普支持的‘星际之门’项目投入5000亿美元?市场又为什么会需要像Meta这样一年内在人工智能方面投入650亿美元的公司呢?”一系列反问,直指当前美国在人工智能领域策略的合理性。
“政客新闻网”进一步表示,包括对华出口限制,这些由华盛顿基于“击败中国”的强烈焦虑情绪而推动实施的政策,其未来走向也让业界提心吊胆。
文章称,一方面,大多数美国科技公司对出口管制怨声载道。这导致他们无法向中国出售产品,为了维持与中国的生意往来,还不得不投入额外的资源开发新的特定产品。“如果DeepSeek的横空出世表明这些限制毫无意义,许多人肯定会乐于见到它们被消失。”
但另一方面,“反华”的保护主义情绪又促使美国政府采纳了一系列行业愿望清单中的措施,涵盖了从放宽人工智能规则,到简化相关建设项目的审批许可等多个方面。这些举措同样因DeepSeek而面临新的质疑,“这些举措是否也在走向失败?还是它会促使美国政府继续加大赌注?”一切都不得而知。
目前可以确定的是,美国科技公司不太可能在短期内放弃争取更多联邦政府投资的努力。
报道称,一些美国人工智能公司一直在敦促新政府加大对人工智能领域的投入。像是OpenAI希望政府加速人工智能基础设施建设,Anthropic则在打“中国牌”,呼吁加强对中国的限制,并放宽对美国企业的监管,以确保美国能够赶在其地缘政治竞争对手之前建立通用人工智能。DeepSeek的突破性进展,似乎为这些公司催促政府行动提供了更为充分的借口。
美国智库战略与国际问题研究中心(CSIS)瓦德瓦尼人工智能和先进技术中心的主任艾伦(Gregory Allen)认为,当前美国科技企业都投身于让人工智能模型变得更小、更快、更便宜的研发热潮中,DeepSeek技术的出现也能推动美国的人工智能发展,“如果说,Deepseek是“花不了那么多钱所能获得成果”的下限的提高,那么与此同时,也存在着上限提高的情况。”
然而,艾伦的言论充满了毫无根据的政治臆测。在他看来,中方“挑”特朗普正式就职总统的这一天公布技术突破,是出于“政治动机”。
他无端揣测称,就像华为在时任美商务部长雷蒙多访华时推出新款手机一样,中方仍在试图借此向新一届美国政府传达信息,表明美国对华出口管制已经失败,进而敦促其放弃相关举措。
“这是中方试图改变新一届美国政府的政治叙事。这就是他们的计划。”他煞有其事道。
和美国智库“新美国安全中心”研究员一边抱怨“中国进展把美国逼到抓狂顶峰”,一边仍要挽尊称“中国在未来几年内难以与美国竞争”的这副别扭劲儿一样,艾伦仍在极力为美国对华限制措施的“作用”辩护。他嘴硬称,DeepSeek的发展或许意味着美国的出口管制需要更多时间才能显现效果,并不一定代表这些措施已经失败。
他还来了一出“优势在我”,称DeepSeek的创新主要来自于技术机制,而这能够为西方所借鉴利用。再加上所拥有的大量先进芯片,最终结果仍将是美国在人工智能领域方面占据上风。
艾伦摆出一副自鸣得意的样子,“他们的改进,无论是架构还是算法,都可以被西方国家利用。而我们所具备的优越芯片架构优势,他们却无法企及。”
美国部分政客和研究人员的这种自我安慰,也恰恰反映出,在科技发展的浪潮中,企图通过遏制他国发展来维持自身优势的做法注定是徒劳的。正如OpenAI公司前高管扎克·卡斯(Zack Kass)所说的那样,美国试图通过制裁限制中国的AI发展,但资源的限制反而激发了中国科研人员的创造力。
The Wire China杂志指出,美国决策者应该反思,通过设置障碍来确保领先地位的方法是否还行得通。美国的出口管制促使中国加速实现技术的自给自足,中美在芯片等领域的技术差距正逐渐缩小,美国的制裁虽然具有破坏性,却可能反过来助推中国的创新能力。
文章写道,美国的出口管制不仅削弱了美国科技公司的收入,也导致全球半导体供应链变得愈发“支离破碎”,“美国越是专注于遏制对手而不解决自身的缺陷,就越有可能加速其领先地位的丧失。”