从洗碗工到斯坦福明星,AI教母李飞飞逆袭人生的5个关键词

李飞飞,是难得的社交平台活跃分子,堪称“AI界大活人”,她的推特保持着几乎每天更新的频率。

最新内容之一是转发斯坦福大学AI实验室关于机器人的最新研究突破:

视频里两只机器手丝滑地互相合作叠衣服、倒茶、将鞋子打包,流畅度满分。

这些流畅的动作是通过一项被称为关系关键点约束(ReKep)的新技术实现的。

这项技术很好地解决了机器人与世界互动时的复杂约束模拟,在空间智能方面有很大的潜力,而这正是李飞飞最新创业的方向。

李飞飞在转发时配文:

我们实验室的新工作展示了视觉和机器学习更深层次的整合!

末尾还有星星眼和加油的小图标,骄傲感溢出屏幕。

李飞飞的推特简介是一连串标签,一个形容词也没有:

斯坦福计算机科学教授、斯坦福以人为本人工智能研究院(HAI)联合主任、AI4ALL联合创始人及主席、研究员(AI、计算机视觉、机器学习、AI医疗)。

虽然她33岁就获得斯坦福终身副教授职称,是斯坦福大学人工智能实验室首位女性主任、斯坦福大学首位红杉讲席教授,还当选美国三院院士,创建了现代人工智能的关键催化剂ImageNet数据集……

这些开创性成就,在几乎由男性统治的全球科技界,无疑是耀眼的存在,但她从未标榜这些,仿佛这些只是追逐科学梦想路上的小小注脚。

除了最新的AI进展以及关于AI监管的一些发文,李飞飞也在推特,宣扬自己最新的自传作品《The Worlds I see》,中文版已于今年4月份出版,题为《李飞飞自传:我看见的世界》

与在AI方面所表现出来的高调不同,李飞飞在宣扬新书时,表现出了非常的谦逊和低调

这种反差,也贯穿了《我看见的世界》全书前后:浩瀚的人工智能发展史和个人的追梦史,对于那些生命中给过哪怕只是很小帮助的人,李飞飞花了很大的笔墨来描述,而对于自己的成就,只是轻轻带过

但又有谁,可以像她一样,能将自己的个人史,写成一部波澜壮阔、跌宕起伏的人工智能发展史?

“移民”“女性”双重弱势标签叠加,进一步增加了冲关的难度。

从成都到新泽西州,为什么痴迷物理的李飞飞转向了AI?是什么点亮了她的北极星?她是如何在科技界实现人生逆势的?她因何创建AI4ALL?她眼中的人工智能是怎样的?如今她又在解决什么样的难题?

书中都有答案。

“飞飞”与好奇心

李飞飞名字的由来,颇具戏剧性。

1976年,李飞飞出生那天,父亲姗姗来迟,并不是因为路上堵车或其他意外,而是因为他一时兴起,跑到公园观鸟,忘了时间。

取名“飞飞”,也是观鸟时想的。

母亲勃然大怒,但也觉得这是一个好名字。

父亲的这种好奇心传染给了李飞飞,小时候,父亲常带她到公园观鸟,去田里看水牛或捕捉昆虫,激发了她对世界强烈的探索欲望。

中学接触到物理后,这成了她最痴迷的科目,连骑自行车转弯时都思考加速度和角动量的变化。

她还对物理学历史上一个又一个伟大人物感兴趣,对阿基米德洗澡时发现浮力定律、牛顿在瘟疫肆虐时躲在家乡写《自然哲学的数学原理》等事件浮想联翩。

为了追逐李飞飞的科学梦,权衡之下,父母举家远赴美国。

在美国上高中时,她有段时间特别迷恋相对论,但是搞不懂,觉得特别难。但突然有一天,做梦的时候好像把相对论搞懂了。她特别兴奋,半夜起来在那写。

沿着对物理的好奇心,李飞飞找到了自己的北极星。

大二的时候,她开始读一些物理学家的书,不约而同地,她最崇拜的物理学家,包括爱因斯坦,他们在人生的后半程,不光是思考物理的问题,光子原子或是宇宙的源头,而是开始思考生命的问题。

李飞飞也开始对生命好奇,最让她好奇的,关于生命的故事,就是Intelligence,为什么生命会Intelligent,而Intelligence到底是什么,是不是只有人类的生命可以Intelligent?

出于这些思考,读博士时,李飞飞找到了AI,那个时候没人知道AI,还是AI的冬天。

好奇心就像一个探照灯,你把好奇心打开,这个灯可以照到不同的地方,也许照到的第一个第二个地方不是你喜欢的,但是你不断的通过这个好奇心去找,不断look for it,你就会看到让你特别特别兴奋,有意思喜欢的东西。

——李飞飞

“浪费的中奖彩票”与北极星

刚到美国的日子很难捱,一家三口挤在只有一间卧室的公寓里,家具是从路边遗弃的垃圾里捡的。

李飞飞父亲在一家华人开的店找到维修相机的工作,每天很晚才下班。母亲在商店找到一份收银员的工作,做重复和机械性的操作,远离了她热爱的文学作品。

为了补贴家用,每一个不上学的日子,李飞飞都会去打零工。

最常见的工作是去中餐馆打杂,每天从上午11点工作到晚上11点,总共12个小时,时薪2美元

在餐馆打杂时,趁着下午换班,李飞飞会利用难得的空隙去读母亲分享给她的文学名著,餐馆经理对此不屑一顾。“他觉得对我们这样的人来说,想象力在生活中是多余的”,李飞飞回忆称。

对这些连英语都不会说的华裔移民来说,阶层跃迁是个遥不可及的梦。

曾经引以为傲的学业也变成负担。李飞飞几乎不会说英语,每天回家做作业,她都要准备两本词典,一本英译中,一本中译英,否则就写不了作业。

尽管学习的时间少得可怜,但李飞飞还是考出了SAT1250数学满分的成绩。

她申请了三所大学,麻省理工、 普林斯顿、和新泽西州立罗格斯大学。

最终,三所学校都发了录取通知,普林斯顿大学更是开出了几乎全额的奖学金。

李飞飞要去普林斯顿读书的消息轰动整个社区,一度还登上了本地的报纸。

但让人略感遗憾的是,李飞飞没有选择医学、金融这种能通向富裕阶层的敲门砖专业,而是选择了自己痴迷的——物理。

“真是张好彩票,可惜浪费了。”邻居们无法理解。

1999年,李飞飞在普林斯顿大学的大学学习生涯即将结束,再次面临科学抱负与现实生活之间的抉择。

读研的诱惑与开启职业生涯的压力让她左右为难。

包括高盛和美林在内的众多知名企业向她抛出了橄榄枝,他们提供了一切:福利、晋升机会、令人艳羡的起薪,当然还有医疗保险。他们承诺免除债务,结束干洗店的劳累,在母亲的健康状况日益恶化的情况下为她的家庭提供保障。

而这唯一要求就是让她放弃科学。

在自己斟酌了大半个星期之后,李飞飞跟母亲在干洗店有了如下对话(以下为原文摘录):

“妈妈,我在考虑几个选择。我面试了几家‘公司’,中文是叫‘公司’吧?就是华尔街巨头。我必须得承认,他们给的条件很诱人。”

“华尔街巨头?”

我意识到,她并不熟悉这些美国文化术语。

“就是股票、交易什么的。搞投资的。当然,还有很多东西要学,不过如果我真的下定决心,我觉得还是能学会的。”

“嗯。”她平淡地回答,“这是你想要的吗?”

“我的意思是……光是薪水就足以改变我们的生活了,而且——”

“飞飞,这是你想要的吗?”

“你知道我想要什么,妈妈。我想成为一名科学家。”

“那还有什么好说的呢?”

李飞飞选择继续学业。

在加州理工大学的博士生生涯即将结束时,李飞飞再次处于人生的十字路口。

世界知名管理咨询公司麦肯锡的合伙人过来招聘,他们正在寻找一个实习级别的分析师。

李飞飞申请了面试,甚至为此买了一套远超预算的西服,小心翼翼地把标签藏在领子下面,这样穿完后马上就能退货。

面试不可思议地进行得非常顺利。

麦肯锡公司立即给了肯定的邀请,并且决定将李飞飞的实习机会转为长期的正式职位

这份工作似乎可以让她卸下长久背负的重担,也是通往每个移民家庭都希望自己孩子拥有的职业生涯的捷径。

但代价还是要放弃她的北极星——科学。

李飞飞回到家里分享了这个“好消息”,告诉她起薪、以及优厚的待遇(以下为原文摘录):

“我们真的要再次讨论这个问题吗?”

“妈妈,我知道,但听我说——”

“我了解自己的女儿。她不是管理顾问,或者其他什么职务。她是个科学家。”

“想想你的身体吧,妈妈!想想我们的开销。搞学术能给我们带来什么呢?”

“飞飞,我们走到这一步,不是让你现在放弃的。”

“这不是放弃!这是我梦寐以求的工作,一份事业,可以让我们摆脱目前的困境。看看我们现在活成什么样了!三个大人住在一个宿舍里!”

母亲停顿了一会儿,也许是在思考这些话,然后回答说:“飞飞,你一直在说自己走的路很‘自私’,就好像你追求科学是在牺牲我们一样。”

“我怎么能没有这种感觉呢?我现在本来可以养活咱们全家,而且——”

“你没明白我的意思。这从来就不是你一个人的路。从一开始,这就是我们全家的路。不管你是注定要成为科学家、研究员,还是其他我没有办法想象的职业,也不管你能不能从中赚到钱,从我们的飞机离开上海的那一刻开始,我们全家就一直在为这个目标努力。”

我不知道该说什么。

“我再说最后一次:我们走到这一步,不是让你现在放弃的。”她是对的。

她总是对的。这一次,不知什么原因,我终于听进去了她的话。我再也不会质疑自己的道路了。

劝阻我已经听得够多了

2006年,计算机视觉研究仍然是一个缺乏资金,且很少受到外界关注的学科。

许多研究人员专注于构建更好的算法。

他们坚信,算法是计算机视觉的中心,如果把机器智能与生物智能做类比,那么算法就相当于机器的突触,或者说是大脑中错综复杂的神经回路。

但李飞飞并不这么认为。在攻读博士期间,李飞飞意识到了这种研究思路的局限性:

如果训练算法的数据不能很好地反映现实世界,那么即使是最好的算法也无法很好地完成工作。

李飞飞的想法是:构建一个能够完全反映真实世界的数据集。

教机器像人一样识别图片中的物体,是人工智能研究领域一直都希望攻克的一项重大难题。

而这也是李飞飞最重要的贡献——创建了数据库ImageNet,有人工智能领域的从业者评论,“没有ImageNet,就没有现在的深度学习革命”

ImageNet的宏伟目标是为每个类别收集1000张独特的图片,从小提琴到德国牧羊犬,再到抱枕,涵盖了22000个类别,总计需要约2000万张图片。

但在起步之初,李飞飞ImageNet的想法就遭到了几乎所有人的一致反对。“我听到的劝阻之声已经多得够我用一辈子了(可能下辈子也够了)。”李飞飞说。

最后她终于遇到了第一位支持者,李凯教授是微处理器架构领域的领军人物。

微处理器架构是一门将数百万纳米级晶体管排列到世界上最复杂的设备中的艺术,因此他比大多数人都更了解指数思维的力量。他相信李飞飞的方向是正确的。

|李凯教授

他毫不犹豫地为李飞飞的研究捐赠了一套工作站,解决了项目亟需的算力问题。

同时因为自己即将离任,他也将自己的学生邓嘉推荐给了李飞飞。

李飞飞和邓嘉组成了两人团队,开启了这个困难重重的项目。

起初,李飞飞采用的策略是支付本科生每小时10美元的报酬,手动搜索并添加图片到数据库。

“我从理论上能理解,但这个工作量也太大了,属于天文数字,可不是谷歌搜索几次就能完成的。”邓嘉面露疑色。

按照既定的速度,ImageNet的完工需要整整19年的时间。

在一位叫孙民的研究生的建议下,李飞飞知道了亚马逊开发的土耳其机器人项目,通过人力众包来完成电脑力有不逮的细碎、精确的智能工作。

正是这款机器人把ImageNet的大学生标注员队伍变成了一个由数十人、数百人、数千人组成的国际团队。

随着获得的支持不断扩大,邓嘉给出的预计完成时间急剧缩短,先是15年,然后是10年、5年、2年,最后不到1年。

但资金需求,也逼近团队所能负担的极限,2009年,李飞飞跳槽去斯坦福,这里为她的研究提供了新的研究资金。

2009年6月,ImageNet的初始版本终于完成:收集了1500万张图片,涵盖了2.2万个不同类别。这些图片筛选自近10亿张候选图片,并由来自167个国家的4.8万多名全球贡献者进行了标注。

ImageNet不仅在规模和多样性上达到了李飞飞多年来梦寐以求的水平,还保持了一致的精确度:每张图片都经过了手工标注,并在层次结构中进行了组织,经过了三重验证。

从数量上看,李飞飞已经实现了既定目标,建立起了当时人工智能史上最大的人工编辑数据集。

“我们的研究大胆且具有前瞻性,虽然并不完备,但能引发思考,其中很多在概念上也很简单。但直到ImageNet出现,一切才变得切实可行起来。”李飞飞说。

机器具备像人一样“看”的能力,历史上第一次变成现实。

更重要的是,她用大数据训练多层神经网络的想法,从图像扩展到语音、文字、视频等其他领域,引爆了持续到现在的AI革命。

消除偏见

2015年,雅虎Flickr一经推出,即麻烦缠身,接二连三出现失误,描述56岁黑人男子的单色肖像为“猿”,将达豪集中营大门的照片标记为攀爬架,把一位脸上涂有彩色粉末的白人妇女贴上了“猿”的标签。

谷歌也陷入了类似的争议,因为谷歌照片服务将两个黑人青少年错误地标记为“大猩猩”。

人工智能是“男性之海”,包括ImageNet在内的数据集由于缺乏多样性,导致算法无意中带有偏见,在非白人、非男性用户身上表现不佳;未经充分测试的算法和存疑的决策又进一步加剧了负面影响。

当互联网呈现的是以白人、西方人和男性为主的日常生活画面时,技术就很难理解其他人群了。

除了数据集不平衡,模型本身是否存在问题?在依赖所有数据的算法架构中,是否隐藏着未被发现的弱点?可以促进训练过程的学习技术有问题吗?

为了消除偏见,李飞飞和她的学生奥尔佳向九年级和十年级的女生开放了斯坦福大学人工智能实验室课程。

邀请少数人群参加人工智能课程的想法非常受欢迎,她们的项目很快就像滚雪球一样发展成为全国性的非营利组织,遍布北美各地校园,使命范围也不断扩大。

很快,她们也开始向有色人种学生和经济困难学生等边缘群体提供类似项目。

在短短几年后,项目被正式命名为AI4ALL,梅琳达·弗伦奇·盖茨(Melinda French Gates)的Pivotal Ventures和英伟达创始人黄仁勋提供了一轮资金。

AI4All还在持续影响世界。

它关注AI领域目前占比很少的学生,如女生、非裔美国人、拉丁裔学生,或低收入背景的孩子,目标是激励更多年轻人追求AI的工作,以增加人工智能的多样性,抵消机器学习算法中嵌入的偏见和歧视的证据。

在业界追逐人工智能未来时,往往肆意而为,缺乏自省,而AI4All的努力表明,至少有一小部分人在逆向而行。

“以人为本的人工智能”

2018年,李飞飞回归斯坦福大学之后,正式宣布启动以人为本人工智能项目,创建了以人为本人工智能研究院(Stanford Human-Centered AI Institute (HAI)),目标将人性置于人工智能的中心。

|HAI 联合主任:John Etchemendy和李飞飞

她在倡议书中提到,“以人为本”的人工智能( Human-Centered AI)源自于三个简单而又有力的想法:

1、为了让人工智能更好地服务于我们的需要,其必须包含人类智慧中的多样性、细微差别及深度。

2、人工智能的发展应与其对人类社会影响的长期研究相结合,并据此加以指导。

3、人工智能的最终目的应该是增强我们的人性,而不是削弱或取代它。

这意味着人工智能,需要与神经科学、心理学和其他学科合作起来,以创建更具有人类敏感性的算法,确保AI帮助人们完成工作,而不是取代他们。

李飞飞和斯坦福大学医学院教授阿尼·米尔斯坦(Arnie Milstein)合作的“环境智能”技术,便是以人为本的很好的体现。

这是从“洗手”这件小事,切入的研究。

洗手是预防感染传播的最重要手段,但直到今天,医务人员不洗手或洗手方法不当仍然是造成医疗环境中疾病传播的重要因素。

李飞飞和阿尼设想了一种旨在用智能且可靠的感知来填充空间的技术,最大的特点就是不会引人注目。

与人类监察员不同,他们的技术将悄然融入背景之中,默默监视,只有在察觉到危险时才会发出警报。

“无论是解决数据中的偏见,还是保护医院里的病人,这一切的共同点是我们的技术如何对待人,尤其是如何保护个体的尊严。‘尊严’,这是我一直强调的关键词。最重要的问题就是,人工智能如何才能尊重人的尊严呢?这个问题是一切研究工作的立足点。”

“以人为本的人工智能。”这个词我琢磨了好几个月,现在终于说了出来,“我一直这样表述自己的理念。我希望这个词能恰如其分地诠释我今后的职业生涯。我希望在未来的岁月里,‘以人为本的人工智能’对你们所有人都能有一定的意义。”

——李飞飞

打开APP阅读更多精彩内容