GPT-5这次是真的来了,今北京时间8月8日凌晨1点,这款从去年就被反复“预告”,不断“剧透”的模型,终于上线。OpenAI用一场罕见的超长75分钟发布会,揭开了GPT-5的全部面纱。
发布会依然由OpenAI CEO Sam Altman主持的。发布的模型有这样几款:
GPT-5:完整深度推理与多模态能力,支持40万token上下文;
GPT-5 Mini:保留80%核心功能,成本降低60%,中小企业理想选择;
GPT-5 Nano:超轻量级(16GB内存即可运行),为移动端和嵌入式设备优化。
在价格上,GPT-5的输入1.25美元/百万token,输出10美元/百万token;GPT-5 mini:输入0.25美元/百万token,输出2美元/百万token;GPT-5 nano:输入0.05美元/百万token,输出0.4美元/百万token。Plus会员($20/月)享受更高调用频次,Pro专业版($200/月)开放无限制使用+专属Pro模型。
相较于GPT-3的文本,GPT-4的多模态处理,GPT-5已经融合所有已知的、最强的AI功能,成为一个超级智能体。奥特曼把GPT-5比作苹果初代iPhone,说用户体验后就不会放手。还有把GPT-4到GPT-5的飞跃比作早期智能手机屏幕到高清Retina显示的进步。随后更直言:“如果说GPT-4相当于大学生水平,那么GPT-5就是真正的专家”。
1、发布会花式秀肌肉
GPT-5的展示阶段较长,效果惊艳,不枉我们熬夜看直播。
发布会以一场“伯努利效应”的实时解析拉开序幕。当演示者提出这一流体力学概念的解释请求时,GPT-5几乎瞬间输出了包含文字描述和公式推导的准确回应。
在展示环节,GPT-5核心展示了编程能力的巨大飞跃、写作能力的提升、语音交互的丝滑、个性化角色的设置,甚至包括如何接入医疗场景。
编程实战环节,演示者要求大模型创建一个帮助伴侣学习法语的互动网站。GPT-5在短短几分钟内生成超过200行代码,构建出包含视觉元素、音频组件和进度跟踪功能的完整网页应用。更令人称道的是,它将网站命名为“午夜巴黎”,展现出意外的创意趣味。
语音交互演示环节,GPT-5不仅能在英语和韩语间无缝切换,更能根据指令调整语速。当被要求“仅用单词回应”时,它精准提炼“人际关系”概括“自豪感与偏见”的复杂话题。
大模型的个性化功能首次亮相。用户可选择四种预设人格:Cynic(批判思考者)、Robot(精准模式)、Listener(共情模式)、Nerd(深度知识型)。支持自定义聊天界面颜色,让AI助手更具个人印记。
压轴环节,奥特曼邀请了一位癌症患者讲述她是如何利用ChatGPT来帮助对抗病魔。她演示了GPT-5如何解析复杂病理报告并提供治疗建议,患者的丈夫认为,GPT-5完全能够理解问题背后的问题,相当专业。
2、GPT-5产品架构升级
通过多个环节展示,OpenAI强调,GPT-5并非简单迭代,而是一次架构变迁——它采用统一智能系统设计,终结了用户手动切换模型的繁琐过程,可以高效处理日常查询,实现毫秒级响应;还推出GPT-5 Thinking引擎,专攻复杂问题,启动多步深度推理。最后还有一个实时路由器,可以自动评估问题复杂度,动态分配处理路径。
这种架构使GPT-5能像人类专家那样在快思与慢想间自由切换。面对简单询问快速作答,遭遇复杂难题则自动进入“思考模式”,在后台展开链式推理。
同时,GPT-5的技术参数实现跨越式升级,上下文窗口扩展至40万token(相当于300页书籍),输出长度达128K tokens,具备多模态能力融合文本、图像、语音及视频理解,支持医学影像分析等高阶任务。
最引人瞩目的是模型可靠性的飞跃。通过整合“通用验证器”(Universal Verifier)技术——源自OpenAI已解散的超级对齐团队遗产——GPT-5构建了自我审查机制,通过对抗训练优化输出质量。
这个机制使深度推理模式下的错误率比o3模型降低80%。当面对知识盲区时,GPT-5更倾向于承认局限而非编造答案,从根本上遏制了“幻觉”问题。
同时大模型的安全机制同步进化。“安全补全”(Safe Completions)策略取代了生硬的拒绝机制,在合规边界内最大化提供有价值信息。比如询问敏感的生物实验操作时,GPT-5会解析原理框架但过滤危险细节,实现安全性与实用性的新平衡。
3、总结
看完发布会,不难发现GPT-5的最大看点是:模型幻觉率大幅下降且性价比显著提升。
首先,GPT-5的能力是“博士级”、“专家级”。奥特曼此前频频给GPT-5预热,多次提及新模型强悍到让他觉得自己“毫无用途”。新模型在能力上确实不拉胯——在上下文、多模态、推理能力、可靠性、安全性等方面显著提升,数学推理、编程、医学分析等超过40种专业测试达到专家水平。
其次,OpenAI专门针对模型幻觉进行了优化训练。例如,与上一代模型GPT-4o相比,GPT-5产生事实性错误的概率降低了约45%,在启用“思考”模式时错误率降幅甚至达80%。
第三,在性价比方面,GPT-5能以更少的token消耗获得超过o3的效果 。比如,GPT-5 thinking在解决复杂问题时,使用的token数量可以减少了50%-80%。定价方面,GPT-5-mini 的价格低于谷歌的 Gemini 2.5 Flash,也是要来一下价格战的节奏。
最后,发布会重点演示了医疗、编程、教育、写作、语音等众多应用场景中的能力。而幻觉下降将有力加强AI在医疗、教育、金融等高信任度场景中的适用性,推动AI走向垂直场景深耕。
种种迹象不难验证奥特曼此前的一个看法:当下,10亿流量的应用比模型更重要。Open AI也准备好在商业化的真金白银中分一杯羹。
尤其针对频频被讨论的AI伦理和风险问题,OpenAI在安全与可靠性上下了不少功夫。比如主要研究信息法与AI人伦理的弗兰克·帕斯夸莱 (Frank Pasquale) 认为,算法决策的不透明性(“黑箱”)使得个人难以理解其信用评分、就业机会、甚至所见信息是如何被决定的。这种不透明性赋予了算法系统巨大的权力,可能导致不公和剥削。
GPT-5提供了免费用户限额使用GPT-5和Mini的机会,让所有人都可以体验何为“真正的专家。”
体验过后,大模型的世界又将变成什么样?我们拭目以待。