奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

ChatGPT还不能自己持续学习、提升

新智元报道

编辑:桃子 犀牛

【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。

近了,近了!

全网多个流出的代码截图显示,满血版o3、o4-mini,以及o4-mini high,有极大概率在下周发布。

不仅如此,在OpenRouter平台上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,据称就是o4-mini。

另一款Quasar模型也杀入竞技场TOP 5,奥特曼对其亮眼的表现做出了回应

这款模型最大亮点在于,上下文长达100万token,一举超越了Claude 3.7 Sonnet。

更令人震惊的是,OpenRouter数据显示,Optimus Alpha才上线没几天一夜爆红,每日处理token数量高达260亿。

另一边,OpenAI正在为开源模型做准备,上周内部召开讨论会,邀请了AI社区大佬提建议。

在TED最新对谈中,奥特曼再次回应了DeepSeek,「我们正在开发一款强大且媲美顶尖LLM的开源模型」。

不论是o4系的发布,还是OpenAI开源模型登场,都足以让AI圈兴奋一段时间了。

o4系模型出世,直接霸榜?

大佬Matthew Berman从更多公开测试的蛛丝马迹中,发现了神秘模型Optimus Alpha的一些亮点。

卓越的多文件协同处理能力

出众的设计美学感知

对复杂系统的直觉式理解

闪电般的响应速度

自如切换抽象层级的能力

在Aider多语言编程方面,可与o3-mini-medium、Grok 3相媲美,拿下53%的分数。

创意写作v3基准上,它甚至击败了Gemini 2.5 Pro,ELO得分1320.8。另外,在SQL的生成上,平均得分为0.830,其中80%为满分。

可以明确的是,新模型专为编程和技术任务构建。在SQL查询生成、Web开发和系统设计方面的性能,均超过了任何公开可用的工具。

比如,在Roo Code社区中,Optimus Alpha使用量已是Claude模型的4倍,深受广大开发者欢迎。

在编码测试中,Matthew给出一个简单的指令——为我创建一个带有功能购物车的电子商务网站。

Optimus Alpha便智能地设计出完整的UI界面,还制作出了「抽屉式购物车」,要知道大多数AI都会失败。

再比如,一次性生成贪吃蛇游戏。

Optimus Alpha可以做到自定义渐变色用于贪吃蛇,深绿色的头部可便于视觉区分。

而且,简洁直观的操控界面,完整的游戏机制,都印证了其编码能力的强大。

最关键的是,代码生成速度令人惊叹,这体验就像随时召唤一位世界顶级工程师。

更强的o4系模型已预定,那么关于开源模型,OpenAI又有怎样的规划呢?

不如,一起看看TED大会上,奥特曼如何回应的AI开源竞赛,以及关于当前爆火GPT-4o生图、AI下一个突破、对就业创造力影响。

GPT-4o承包创意工作,人类怎么办?

周五,奥特曼现身温哥华TED大会现场,与TED负责人Chris Anderson进行了一场深入的对谈。

对谈一开始,Anderson用最近爆火的Sora生图功能生成了一张图片,图片中奥特曼正向他分享着惊人的信息。

Anderson表示这图画的还不错,至少是个B+。接着他又展示了一张图片,这次他让Sora描绘一下智能和意识的区别。

这张图真的让Anderson感到震惊了,因为这显然不只是图像的生成,它似乎理解了你想要什么。

对此奥特曼表示,这个图像生成的功能是GPT-4o的一部分,包含里面的所有智能。

「这也是为什么它能做出这些让人惊叹的事情。」

面对如此智能的AI,Anderson不禁问奥特曼,「我的未来该怎么办?」。

奥特曼说人们对此有两种看法。一种是「天啊,它把我做的事全干了,我该咋办?」。

而另一种是「每次技术革命都这样」,新的工具能提升人的能力,让人做的更多。

「所以适应起来应该不难。」

这时,Anderson突然冒出一句:「这会不会是个版权问题啊?」

观众哄堂大笑,现场还夹杂着掌声。看来大家都对这个问题很感兴趣。

奥特曼的回应是,如果艺术家愿意把自己的风格授权给别人用,那么可以为他们设计分成机制。

也就是说,未来不只是「版权」问题这么简单了,「风格」也将会成为重要的车资产。

不过,真正棘手的,在海量的AI作品面前,要怎么区分「灵感借鉴」和「抄袭模仿」呢?

OpenAI将推最强开源LLM

Anderson问奥特曼,DeepSeek的出现有没有让你有点慌?

奥特曼认为开源很重要。就在昨晚,他们还在开会讨论开源模型的参数和方向。

OpenAI正打算开源一款非常强大的模型,性能比现在所有的开源模型都要好。

奥特曼还强调了一下,虽然他们在开源方面行动的有点晚,但他们会做的很好。

虽然DeepSeek势头迅猛,但并没有影响ChatGPT的增长速度。

「我从来没见过任何一家公司有这种增长速度。ChatGPT的增长简直疯狂!」奥特曼表示。

根据上次公布的数据,OpenAI每周有5亿的活跃用户,而且还在飞速增长。

奥特曼还提到了新的「记忆」功能。模型会慢慢了解你,陪你走过人生的不同阶段。

他希望OpenAI能继续保持专注,做出这个领域里最顶尖的产品。

AI双突破,2年研究半天搞定

奥特曼预计AI将在两个方向上有重大的突破。

首先是在科学领域。

奥特曼说他相信科学发现是让人们生活越来越好的最重要推动力。有了新发现,我们就能用更少的资源做更多的事,把「可能」的边界往外推。

OpenAI最新的模型已经开始让科学家们兴奋了,他们的效率比以前高得多。

借助AI工具,很快会开始看到在对抗疾病方面的一些实质性进展。

至于物理学,奥特曼说可能需要更长时间,但很期待。

另一个重要方向是软件开发。

奥特曼说未来几个月,这个领域就会发生翻天覆地的变化。

他说一些工程师现在一个下午就能完成以前两年才能做完的工作!

对于外界的一些传闻,奥特曼说他们并没有偷偷藏着有意识的模型,以及能自我改进的模型。

奥特曼还对他们模型的安全性很有信心。

「有人会说各种事情,但现在全球大概有10%的人正在使用我们的系统,我们对自己的安全记录非常骄傲。」

他还透露,OpenAI已经准备好了一旦发现危险就迅速叫停的机制。

这就是一个不断试错的过程:把系统推向现实世界,在风险还相对可控的时候收集反馈,发现问题,然后解决。

ChatGPT不是AGI

奥特曼说ChatGPT还不能算是AGI,因为它还不能自己持续学习、提升。

它也没办法在自己不擅长的领域主动变强,自主地探索新科学、更新知识库。

甚至还不能像人类一样坐在电脑前完成各种知识型工作。

对于到底什么是AGI这个问题,奥特曼直接讲了个笑话:「你把10个OpenAI的研究员关一个屋子里,让他们定义AGI,估计能整出14个不同的答案。」

目前都没有个统一的说法。

所以比起「AGI啥时候来」,更重要的是认识到我们正处在AI能力指数级增长的曲线上。

你可以说「这是我眼中的AGI」,别人可以说「超级智能在那儿」,但不管咋样,我们都得面对这个超级厉害的系统带来的好处,同时想办法让它安全。

整场近一小时对谈中,奥特曼其他的一些精彩观点:

要盯紧AI智能体的安全问题。

奥特曼分享成为父亲对他个人产生了深远的影响,他否认了AI会对他的孩子未来构成风险,但也承认有更大的责任去塑造一个对孩子有积极影响的世界。

奥特曼还描述了一个未来,AI将比他的孩子更聪明,但他认为这是一个好事。持续的创新、丰富的资源和智能AI将会无缝融入日常生活,未来一代人将会觉得当前人们又辛苦又落后。

打开APP阅读更多精彩内容