【#Grok2攻克9.11和9.9谁大的难题#】
北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)。从xAI内部测试结果来看,相较于上一代模型,Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。
值得一提的是,Grok-2在数学推理(MathVista)方面表现登顶测试榜首。对于很火的“9.9和9.11比大小”的问题,难倒了GPT-4o,但没难住Grok-2(sus-column-r)。意外收获是,经典的“strawberry”数“r”难题,也被Grok-2顺利攻克。