o1满血版泄露了!
没想到,OpenAI还搁那儿“今年一定”呢,不少网友已经率先上手体验到了(doge)。
事情是酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,大家伙儿还都能卡bug直接用!
最初发现此事的网友,测试确认泄露模型具有奥特曼所说的图像推理能力。
△
图源:𝕏@legit_rumors
而日志也显示该模型就是o1本模。
于是,赶在OpenAI出手修复之前,网友们抓紧大玩特玩了一波——
满血o1到底有多牛
和已经发布的o1-preview、o1-mini最直观的不同是,泄露出来的o1支持上传附件。
这也就意味着,终于能测测o1的多模态能力了。
网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。
对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。
思考了18秒之后,o1给出答案:18。
答案正确:
再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。
在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。
不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。
ID为anagh的𝕏网友,给泄露模型和GPT-4o做了个同屏对比: