Google深夜发布免费版o1,“暴打”OpenAI

OpenAI又是被抢头条的一天。

发布会前夕,Deepmind抢先发布了与o1模型类似的Gemini 2.0 Flash Thinking模型,在大模型竞技场LMSYS上杀疯了。

随后,OpenAI发布会则重点展示了桌面版ChatGPT与Mac应用的深度集成能力。

可以说,桌面版ChatGPT正有望成为你最靠谱的生产力搭子。

抢先实测Google版o1,效果大出所料

没人比Google更懂“狙击”。

今天凌晨,Google重磅推出了Gemini2.0 Flash Thinking模型,从名字上就可以看出,这是一款类似于OpenAI o1的推理模型。

转投Google阵营的Logan Kilpatrick在X平台上发文称:

“就在你以为一切都结束了的时候……我们推出了Gemini 2.0 Flash Thinking。这是一种新的实验模型,可以解锁更强的推理能力并展示其思考过程,能够以闪电般的速度解决复杂问题,以及还有更多功能。”

在大模型竞技场LMSYS上,真·战绩可查。

当然,旁人说得再好,不如亲自上手体验。

我们也第一时间上手实测了这款新模型,先来“9.11和9.8哪个大”的经典问题,结果新模型轻松拿捏,甚至还能用钱举例。

“strawberry中有几个r”也手拿把掐,点开后还能看到其清晰的“思考”步骤。

面对职场分水难题“你有4杯水,来了5个领导你该怎么办?”,Google版o1又会如何应对?满分十分,你给这个答案给几分?

对于“有轨电车难题”的回答,除了前面有条不紊的回答,我更喜欢这位新选手最后一句高情商的回答:

“理解你的思考过程比得到一个‘正确’答案更重要。”

为了考察新模型是否“偏科”,我也上传了一道考研数学热门题,并让它和OpenAI o1模型同时作答。

省去繁琐的运算过程后,两者得出的结果一致,但Google版o1只花了27.5秒,相比之下,OpenAI o1花了足足1分32秒。

当然,最好的评价还是亲自上手。附上体验地址。

给Mac装上最强大脑,这才是真正的人机交互

在被抢头条后,OpenAI也不慌不忙地如期举行了发布会。

全新桌面版ChatGPT将超越单纯的问答,能够通过与30多种应用协作来辅助提升你的写作和编程能力。

使用方式也十分简单,用户只需确保目标应用正在运行,然后在ChatGPT聊天栏中点击“与应用协作”(Work With Apps)按钮并选择相应应用即可。

聊天栏上方会显示当前协作的应用程序,用户可以随时查看ChatGPT将要处理的内容范围。这些互动记录会保存在用户账户中,直到被删除或经过30天自动清除。

在实际演示中,OpenAI工作人员通过Mac版ChatGPT展示了多项实用功能。

以Warp控制台为例,ChatGPT能够根据演示人员要求快速生成Git命令来统计代码库的每日提交次数,并将其数据可视化为富有圣诞节气氛的柱状图。

在这个过程中,它充分使用了Advanced Data Analysis(高级数据分析)等内置功能。

为保护用户隐私,OpenAI演示人员表示,只会访问用户明确授权的应用内容。

但在查阅OpenAI官网后发现,这些交互数据可能会被用于模型训练,因此你需要在设置中调整数据使用权限,甚至按需禁用应用协作功能。

在IDE方面,演示人员通过Xcode展示了应用协作功能的技术细节。通过MacOS的可访问性API,ChatGPT能够精确识别并操作界面元素,包括文本字段、行数及内容等。

“它还告诉我们这个文本字段有37行,我们可以向下检查确认是否是37行。”

有趣的是,演示过程再次上演翻车场面。

当要求ChatGPT添加“观察者”功能,选择变化加载文本区域时,o1生成的代码在Xcode运行失败,直到修正过后才成功。

值得一提的是,这项功能不仅支持Xcode,还覆盖了VS Code、Jetbrains全家桶等主流开发工具。

写作场景是日常最实用的场景之一。

Mac版ChatGPT也将支持Notes、Notion和Quip等多款应用,为用户带来全新的写作协作体验。

作为旧金山徒步历史导览员,OpenAI演示人员通过自己正在设计的导览项目生动展示了这些新功能。

比如说,在Notion文档中,他正尝试编写关于旧金山历史人物“诺顿皇帝”的介绍,但如何描述历史人物的生平,如何挖掘有趣细节等等都是一门不小的学问。

借助搜索功能,ChatGPT能够查证历史文献和研究资料,快速补充诺顿皇帝在旧金山的活动轨迹、与当地居民的互动等生平细节,并对其过往行为进行深入解读。

为了减少AI的机器味,我们也能要求其模仿Notion文档中的语言表达方式和叙述节奏,对内容进行调整,使其更加流畅自然。

除了文本交互,ChatGPT高级语音模式还有新玩法。

作为一名职业萨克斯演奏家,OpenAI演示人员还能与前不久刚推出的“圣诞老人”限定语音讨论节日派对曲目的选择。

演示人员还即兴演奏了一段动听的萨克斯乐曲。

目前,上述提到的新功能已在macOS ChatGPT最新版本中上线,而Windows版本很快也会推出。不妨再耐心等待一下。

发布会最后,OpenAI CPO Kevin Weil还预告,明天将会发布“令人兴奋”的新产品。

而Google、Anthropic等公司面对年底最后一轮AI狂欢,是否又会再次放大招“狙击”?

一切都值得拭目以待。APPSO也将在明天凌晨第一时间送上最新报道。

作者:APPSO

打开APP阅读更多精彩内容