维基百科+大模型打败幻觉！斯坦福WikiChat性能领先GPT-4，_

维基百科+大模型打败幻觉！斯坦福WikiChat性能领先GPT-4，他们的最佳模型在新的基准测试中获得了97.3%的事实准确性，远远超过了GPT-4的66.1%。此外，WikiChat还在相关性、信息性、自然性、非重复性和时间正确性方面领先其他模型。