美媒:特斯拉采集的很多数据是“垃圾”,它成为不了AI公司

杨立昆:“特斯拉缺乏顶尖科研团队,自动驾驶突破不会来自他们。”

马斯克与特斯拉

马斯克与特斯拉

凤凰网科技讯 3月11日,商业内幕发文称,马斯克想让特斯拉成为一家AI公司的愿望可能不会实现,因为其引以为豪的自动驾驶数据采集系统,效果难以达到预期。

马斯克曾表示,特斯拉不应再被视为一家电动汽车制造商,而应是一家AI公司。他的信心源于公司独特的数据库:从全球特斯拉车辆中收集的海量驾驶视频数据,总量达PB级。理论上,这些真实世界的数据是训练车辆实现完全自动驾驶(无需人类干预)的关键——这正是马斯克对特斯拉未来的核心愿景。但问题在于:这些数据可能并不像他声称的那样有用,甚至部分毫无价值。

开发与人类驾驶水平相当的AI,与打造类似ChatGPT的自然语言处理模型截然不同。ChatGPT通过爬取互联网上的千亿级词汇训练,目标是依靠模式识别提供可靠信息和答案,但其结果常因错误而尴尬。然而,若控制车辆的AI出错,后果可能是致命的。

驾驶涉及更多变量,如路况、天气、施工、交通流变化、其他车辆动态等。自动驾驶AI的核心挑战在于掌控这些变量,并能对突发状况作出反应。仅靠大量高速公路行驶视频训练,AI难以学会处理导致碰撞的危险“边缘案例”(edge cases)。

匿名自动驾驶公司高管表示:“常规路况下,特斯拉的自动驾驶系统或许能平稳驾驶,但遇到异常情况就束手无策。如果只是模仿人类行为,AI甚至会习得闯红灯的坏习惯——毕竟90%的人会在停车标志前滑行。”

这也解释了为何特斯拉的竞争对手(如Waymo)使用激光雷达和雷达构建3D环境模型。Waymo研究主管德拉戈・安杰洛夫曾称,仅靠摄像头方案“需要顶尖的摄像系统,这是高风险且不必要的赌注”。

Meta首席AI科学家杨立昆同样质疑特斯拉的数据优势:“数据量的边际效益会递减。即使数据翻倍,系统仍远未达到人类可靠性。”目前尚无企业实现L5级全自动驾驶,但青少年“仅需20小时练习即可掌握驾驶”,这暴露出现有AI架构在理解世界和高效学习方面的重大缺陷。

Snorkel AI首席执行官亚历克斯・拉特纳指出,独特数据确有优势,但“垃圾进,垃圾出”的法则依然适用:“如何区分优秀与糟糕驾驶者的视频数据?这至关重要,因为模型会学习最常见的行为。”

杨立昆犀利批评道,“特斯拉在AI研发界几乎零存在——他们不参加学术会议,不发表论文,仿佛隐形。”Waymo已在美国四城运营700辆自动驾驶出租车,2024年营收预估超1亿美元。相较之下,特斯拉自动驾驶系统频现危险操作,如新泽西高速出口险撞、中国路口闯红灯等

马斯克承诺6月在奥斯汀启动机器人出租车试点,但杨立昆断言:“特斯拉缺乏顶尖科研团队,自动驾驶突破不会来自他们。”杨立昆预测,实现类人自主智能还需十年,“让AI像人类一样通过视频理解世界,需要范式变革”。(作者/陈俊熹)

更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

打开APP阅读更多精彩内容