谷歌创始故事:Larry Page 遇见 Sergy Brin

如果两人没有相遇,还会有那个改变世界的搜索引擎的诞生吗?

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:最近,不到50岁的Google创始人Larry Page和Sergy Brin近日宣布辞去所担任的公司高管职务,成为少数不再在自己的公司担任日常职务的科技巨头创始人之一。两人的退位标志着一个时代的落幕。而随着Google创始人退出管理岗位,是时候回顾一下即将组织全世界的信息的合作伙伴关系是怎么开始的了。此文摘选自《 In The Plex: How Google Thinks, Works, and Shapes Our Lives》,作者为Steven Levy。

一、孪生兄弟

1995年夏天,准备去斯坦福大学读研之前,22岁的Larry Page参加了一个针对入学学生的计划,活动内容其中的一项是旧金山之旅。他的导游是一位年龄相仿的年轻人,喜欢玩滚轴溜冰,会玩空中飞人,有数学天分,已经在斯坦福大学读了2年的计算机科学研究生。

“我认为他相当讨厌,”Page后来是这么评价他的导游,Sergey Brin的。

作为计算机科学家的儿子,Page从小在密歇根州的兰辛长大,计算机就是他的主要语言,后来又在密歇根大学获得了计算机科学学位。他不是社交动物——跟他交谈过的人经常怀疑他是不是有阿斯伯格综合症——他只需要不说话就能让人感到不安。

不过,对于认识他的人来说,Page的才智和想象力显而易见,他的野心也一目了然。1995年的斯坦福不仅是追求尖端计算机科学的最佳场所,而且由于互联网的蓬勃发展,它也是雄心抱负的世界之都。

Page选择到斯坦福大学计算机科学系的人机交互小组工作,他的指导老师Terry Winograd对Page的怪异想法的看法是“更像科幻小说而不是计算机科学”。

尽管性格不同,但从某些方面来说Page和Brin像是孪生兄弟。在追求自己的信仰时,两个人就像岩石一样倔强。

而Brin则是出生在俄罗斯,他一家移民到美国的时候他才四岁。他的英语仍然保持斯拉夫的味道,他的讲话时不时会伴随着旧大陆的时代错误,比如,别人说“stuff like that”,他会说“whatnot”。他去斯坦福继续深造时才19岁,此前他在马里兰大学在父亲的教导下只用3年就读完了本科。他是斯坦福大学有史以来最年轻的学生之一。Sergey则是个古怪的孩子,经常会穿着旱冰鞋溜过斯坦福的走廊。但是那些教授明白,在那种可笑的背后是一颗强大的数学头脑。到达斯坦福大学后不久,他就通过了博士学位所需的所有考试,然后就是任意去体验各种课程,直到找到合适的论文选题为止。除了学习以外,课余他还练练游泳、体操和帆船等运动。

尽管性格不同,但从某些方面来说Page和Brin像是孪生兄弟。两人都对学术的英才教育最为自在自在,因为在这里头脑胜过其他一切。两者都对他们作为计算机科学(CS)学生而享受到的超连接世界即将扩散到整个社会有着与生俱来的理解。他们有一个共同的核心信念,那就是数据是第一重要的。在追求他们的信念时,两人都很倔强。那年9月,当Page安顿下来时,他跟Brin成为了密友,亲密到大家把两人看作是一个集合:LarryAndSergey。

还有一点让他们的伙伴关系进一步巩固,那就是他们见面时都还没有确定论文主题。Brin拿到了美国国家科学基金会(National Science Foundation)的奖学金金,并大体上把关注点放在数据挖掘上面,他帮助建立了一个叫做MIDAS(Mining Data at Stanford)的研究小组。在1995年他在斯坦福大学网站上发布的简历里面,他谈到了自己的一个“新项目”是以生成个性化的电影收视率的。他跟指导老师Hector Garcia-Molina以及另一位学生一起合作了另一个项目,是通过自动搜索文档内容的重复情况来检测到是否侵权。

Page也在找论文主题。他给指导老师Terry Winograd介绍过的一个想法还比较有希望,他想跟Brin合作开发一个系统,让大家可以对网站做出注释和评论。但是,Page对注解的思考越多,情况就变得越混乱。那些大网站可能还会有很多人想要对页面进行标记。但你怎么才能确定谁会去发表评论,或者你会先看到谁的评论呢?为此,他说:“我们需要一个评级系统。”

由人来确定评级是不可能的,因为这不切实际而且也不可靠。只有完善的、可有效执行,并基于充分数据的算法才能提供可靠的结果。因此,问题就变成了要寻找合适的数据来确定谁的评论比其他评论更可信或更有趣。Page意识到这样的数据已经存在,只是没有人真正去使用它。他对Brin说:“我们为什么不用Web的链接来实现它呢?”

作为学术界后代的Page知道,网络链接就像学术文章里面的引用一样。众所周知,你不需要看内容也能确定哪些论文才是真正重要—只需要统计一下其他论文中注释和参考文献里面引用这篇文章的次数有多少就行了。Page认为,这一原则也适用于网页。但是要想拿到合适的数据很困难。网页的对外链接是透明的:内置在代码里面的,是很容易就能识别的,你通过那个网页的一次鼠标点击就能访问到目的地的标记。但是都有谁链接了某个网页却一点儿也不明显。为了找出这个问题的答案,你必须设法去收集连接到某页面的链接,组织成数据库。然后,再后向去找出答案。

这就是为什么Page把这个系统叫做BackRub 的原因。Page曾经对记者说:“超文本的早期版本有一个悲剧性的缺陷:没法从反方向跟踪链接。而BackRub将扭转这一局面。”

Winograd 认为这是一个非常好的项目点子,但做到绝非易事。他告诉Page说,要想做到这一点,必须把WWW的大部分链接结构都捕捉下来才行。Page说,当然,他会去把web下载下来然后掌握它的结构。他认为这大概需要一个星期左右。但后来他回忆说:“当然,结果这花掉好几年。”但Page和Brin锲而不舍。Page每隔一周就会到Garcia-Molina的办公室去要磁盘和设备。Garcia-Molina说。“行啊,这是一个很棒的项目,但是你得给我个预算啊。”他要求Page报个数,说出他需要抓取多少Web的东西,并估计需要多少张磁盘。Page说:“我想把整个web都抓下来。”

由于Page不算是世界级的程序员,所以他请了一位朋友来帮忙。Scott Hassan是斯坦福大学的全职研究助理,他跟Brin也是好朋友,两人是在Brin刚到斯坦福大学的第一周在极限飞盘比赛中相识的。Hassan说,Page的程序“错误太多了,这可不好笑。”

Hassan用Python(这是一种更加灵活的语言,越来越成为开发基于Web的程序的流行选择)重写了这个在Web上搜寻数据的程序。这个程序会去访问一个网页,找到上面所有的链接,然后将之放入队列之中。然后,程序会检查它之前是否访问过那些链接页面。如果没有的话,它会把链接放到将来要访问的目的地队列当中,然后重复此过程。由于Page不熟悉Python,Hassan就成为该团队的一名成员。

而数学天才Brin承担着处理数学问题的艰巨任务,其目标是发现Page他们对不断发展壮大的web所进行的庞大调查所发现的那一大堆链接背后的意义。

即便这支小团队正在走向某处,但他们也不大确定自己的目的地在哪里。Hassan 说:“Larry并没有计划。做研究就是这样,一边探索,一边看看什么行得通。”

到了1996年3月,他们开始进行测试,起点是一个网页——斯坦福大学计算机科学系的主页。他们的程序找出了链接到这个网页的链接,进而找出链接到斯坦福大学网站的所有网站,然后是链接到那些网站的网站。

Page说:“我们意识到它确实非常有效。我说,‘哇哦,看来大问题不在于注释。我们不仅应该把它用来对注释进行排名,还应该用来对搜索进行排名。”对web上的每个网页进行排名有一个似乎很明显的应用。他说:“对我和我们的整个团队来说,有一点是很清楚的,那就是如果你有一种手段不仅可以基于页面本身对其进行排名,而且还可以基于世界对该页面的看法对其进行排名的话,那对于搜索来说就真的很有价值了。”

在当时,web搜索的领导者是DEC旗下Western Research Laboratory的AltaVista。尽管AltaVista的创造者也意识到了要收集web的一切,但却错过了利用链接结构的机会。AltaVista分析的是每个网页里面都有什么——利用类似每个单词的出现次数这类的指标去分析,从而去确定查询特定关键字跟网页的匹配度。

哪怕没有利用搜索来赚钱还没有明确的手段,但AltaVista还是有很多的竞争对手。到了1996年,好些公司的高管都自诩自己的服务最有用,但他们也承认,在包罗万象的web与他们蓬勃发展的技术之间的竞争中,web总是胜出。AltaVista的工程总监说,最好的办法是朝着问题投入大量的硅片(编者注:意思是计算能力),然后希望得到最好的结果。

Web搜索公司里面没人提到过要利用链接。

而这些链接就是在斯坦福大学的一间宿舍里面的计算机上跑的一个研究项目取得顶级表现的原因。Larry Page的PageRank非常强大,因为它聪明地分析了这些链接,并给它们分配了一个范围在1到10之间的数字,让你一眼就能看出某页面相对于web的其他页面的突出程度。BackRub 的早期版本之一只是简单计算了导入链接,但是Page和Brin 很快就意识到,重要的不仅仅是链接的数量。生成链接的页面的地位越突出,则链接的价值就越高,并且在计算网页本身的最终PageRank值时,链接的价值也会越高。

关于名字,Page和Brin曾经认真地考虑过“The Whatbox”,直到他们意识到发音太像“wetbox”了,不利于家庭和谐。然后Page的舍友建议说可以叫做“googol”。

PageRank还有一个强大优势。对于依靠传统的内容分析方法的搜索引擎而言,web构成了严峻挑战。那上面的网页浩如烟海,而且随着越来越多的网页被添加上去,那些系统的性能下降是不可避免的。对于这些网站而言,web的快速扩张是个很令人头大的问题,会耗尽它们的资源。但是因为PageRank,BackRub却会随着web的壮大而变得更好。新的网站意味着更多的链接。Brin解释说:“PageRank的好处是可以从整个WWW上学习。”

Brin 和Page进入到了快速迭代和发布的模式。如果给定查询的结果页面排序不正确,他们马上就回到算法那里看看出了什么问题。Page拿关键词“大学”的排名作为石蕊测试。他特别关注自己的母校密歇根大学以及他目前的学校斯坦福大学的相对排名。Brin和Page均认为斯坦福大学的排名应该更高,但密歇根大学却高居榜首。这算是算法的缺陷吗?不是。“我们认为密歇根州大学的网站更有料,所以这是合理的,”Page说。

这种排名展现了PageRank的威力。相对于从商业搜索引擎获得的结果,它让BackRub变得有用许多,因为用前者查询“大学”得到的结果列表似乎完全是随机的。用AltaVista搜索这个词得到的第一个结果是俄勒冈光学中心。

在此之前,编制大学清单并对其进行排名一直都是很复杂的,是一项既耗脑力又耗体力的任务。为此,一些杂志要雇用大型团队干好几个月。机器能够炮制出一个跟受过良好教育的市民的直觉一致的排名的几率很低。但是BackRub 对这些统计信息一无所知。它只是知道了如何利用利用一个事实,既web社区建立的链接其实相当于制造了一个排名,一个比任何一位杂志编辑或知识策划者能想到的都要好的排名。

二、从BackRub到Google

作为可能的论文的一块垫脚石,Page和Brin把他们的项目给发布出去了。但他们同时开始着眼如何把自己的创造物变成赚钱的东西也是不可避免的。斯坦福大学的计算机课程既是学术机构,也可以说是企业的孵化器。但是,当时Brin和Page对此仍然心有抵触。两人选择去斯坦福大学就读,本来就打算像他们的父亲一样成为博士的。

但是想把他们的搜索引擎授权出去并不容易。雅虎认为没有必要去买搜索引擎技术。与AltaVista达成交易的任何可能性全被位于马萨诸塞州DEC总部的管理层所制止,原因:非我发明(Not Invented Here)。最接近跟Page和Brin成交的也许是Excite。这是一家立足于搜索的公司,由一群跟Larry和Page很像的斯坦福极客创立。但是,由于VC要求以空降CEO(《时代镜报》前高管George Bell)的方式对Excite进行“大人的监督”,交易最终未能成交。

BackRub团队曾到Bell的办公室做过演示。他们在一个窗口打开了BackRub,然后另一个窗口打开了Excite进行面对面的比试。他们测试的第一个查询是“ Internet”。Excite排名靠前的搜索结果是一些中文网页,英文单词“Internet”是夹杂在一堆汉字中出现的。而BackRub返回的前两个结果都是告诉如何使用浏览器的页面。这样的结果最有可能是查询者想要的。

但是Bell的态度显然很沮丧。这帮斯坦福大学学生的产品实在是太好了。他解释说,如果Excite弄的搜索引擎一下子就能向大家提供他们想要的信息的话,那用户查完马上就会离开自己的网站了。而Excite的广告收入就靠大家呆在网站上——在当时,“粘性”是网站最需要的指标——因此,部署BackRub的技术反而会适得其反。

Scott Hassan说,1997年初的时候他就敦促Larry和Sergey离开斯坦福大学去成立自己的公司。因为:“其他所有人都正在这样做。我看到Hotmail和Netscape的表现都非常好。热钱正在流入硅谷。所以我对他们说:‘搜索引擎就是我们要的想法。我们应该做这个。’但他们并不这么认为。Larry和Sergey都非常固执,认为可以在斯坦福大学设立这个搜索引擎。

Brin后来说:“当时我们还没有……一种创业者的心态。”。

1997年9月,Page和Brin 决定把BackRub改名为自己所希望的合适给企业用的名称。他们曾认真考虑过“The Whatbox ”,直到有一天他们意识到这听起来太像“wetbox”了,不利于家庭和谐。然后Page的舍友建议他们可以取名“googol”,这是个数学术语,指1的后面有100个零的数字。Brin在几年后解释说:“这个名字反映出我们所做的事情的规模。实际上,后来它成为了我们更好的名字选择,因为现在我们有了几十亿的网页、图像、群组以及文档,而且每天要进行数亿次的搜索。”后来Page却把名字给拼错了,但也没事了,因为正确拼写的域名已经被别人注册了。但“Google”还没人用。Page说:“这个名字容易写,也好记。”

一天晚上,Sergey 用一个新的开源图形处理程序GIMP设计了首页,还用不同的颜色拼出了新公司的名称,logo看起来很像儿童积木一样。给人以和蔼可亲的感觉。Page说:“他希望公司既好玩又充满朝气。” 主页上有一个用于输入查询请求的输入框,输入框的下方有两个按钮,一个用于搜索,另一个写着“I’m Feeling Lucky”,这是一种令人惊讶的自信,突出了它跟竞争对手不同:Google能够在你第一次尝试时就锁定你的请求。而且跟其他的很多网页不一样的是,Google的主页内容太少了,看起来就像还没有完工一样。但是网页的内容越多,运行速度就会越慢,两人(尤其是Page)均认为,在取悦用户方面,速度至关重要。后来大家称赞Google的网页设计中对白区的使用有禅的味道,Page觉得这很好笑。他说:“这种极简主义是因为我们没有网站管理员,只能亲力亲为。”

与此同时,从BackRub摇身一变出来的Google日益发展壮大,已经大到斯坦福大学的设施撑不住的地步。Google与其说这是一个研究项目,不如说是在一家私立大学里面运营的互联网初创企业。Page和Brin不愿就他们的工作写一篇论文的事情在系里面已经变得臭名昭著。Terry Winograd说:“大家都说,‘为什么搞得这么神秘?这是个学术项目,我们得知道它是怎么弄的。’”

在Page内心深处对信息似乎有着矛盾的心理。一方面,他热衷于知识分享的黑客哲学。那是他的项目要实现的宗旨的一部分:让人类知识容易获取,让世界变得更美好。但是他也很想保护自己来之不易的专有信息。而且,对Brin 和Page而言,写论文没有可开发东西那么有趣。Winograd 最终说服他们在一个公共论坛上对PageRank做出解释。1998年5月,他们在澳大利亚举行的一次会议上发表了一篇论文,题目叫做 “一个大型超文本Web搜索引擎的剖析”。

Google每天处理的查询量很快就达到了10000次。有时候它甚至消耗掉斯坦福大学一半的互联网容量。它对设备和带宽的需求都非常旺盛。Page说:“我们只能去求人去借资源。周围有一堆的计算机,我们设法弄到了一些。” Page的宿舍基本上变成了Google的运营中心,来自各个制造商的各种各样的计算机塞满了一个自制版的服务器机架——那是一个像搭积木一样搭出来的存储柜。

为了存储他们爬取的数百万个网页,两人必须购买自己的大容量磁盘。Page找到了一个以原价十分之一出售翻新磁盘的地方。那些磁盘只要把磁盘操作系统替换掉就可以正常工作。Page说:“我们有120个磁盘,每个盘大概有9G。所以整个空间大概有1个TB左右。”但很显然,很快他们就得有更多的设备。接下来怎么办?他们问自己。

斯坦福大学并没有把他们赶出去—运营萌芽中的Google的错综复杂,被一个有趣的东西是在本系酝酿的自豪感压过了。Grace-Molin说:“我想这个可以做成一篇很棒的论文。我想他们的家人也会支持他们去拿博士学位。但是做公司的吸引力实在是太强了。”

他们别无选择。没人会为Google给出足够的钱。而他们所吸引到的快乐访客也让他们充满信心,相信自己的努力一定会有所作为的。

当他们解释了为什么永远都不会在首页上放置展示广告时,杰夫·贝佐斯对Page和Brin的热情和“健康的倔强”感到着迷。

他们向Dave Cheriton教授寻求建议。Dave Cheriton有过在斯坦福大学创办公司的经验,他的公司最后以2.2亿美元的价格卖给了思科。Cheriton 建议他们跟他从前的商业伙伴Andy Bechtolsheim去见面。当晚午夜左右,Brin就给Bechtolsheim发了一封电子邮件,结果马上就收到了答复,问这两位学生第二天早上八点是否可以到Cheriton家中,因为他每天每天上班都会经过那里。在那个不合时宜的时刻,Page和Brin就在Cheriton家有以太网连接的门廊上给Bechtolsheim演示了他们的搜索引擎。演示给Bechtolsheim 留下深刻的印象,但由于着急着要赶去办公室,他主动提出给两人一张100000美元的支票,从而缩短了这次会面的时间。

但Brin说:“我们还没有银行帐户。”

Bechtolsheim说 :“等你们有了账号时就把它存起来。”然后驾驶着他的保时捷赛车一骑绝尘。那架势稍微有点炫耀的味道,就好像他是在上班的路上去取一杯拿铁一样,他刚刚投资了一家将会改变世界获取信息方式的企业。Brin和Page用一顿汉堡王早餐来庆祝此事。那张支票则在Page的宿舍里呆了一个月。

此后不久,其他天使投资人也加入了Bechtolsheim的行列, Dave Cheriton也是其中之一。还有一位叫做Ram Shriram,是硅谷的一名创业者,他的公司最近放过被Amazon.com收购。1998年2月,Shriram跟Brin 和Page见了面。尽管他一直对搜索引擎的商业模式持怀疑态度,但对Google却印象深刻,所以一直为他们提供建议。在两人跟Bechtolsheim见过面后,Shriram又邀请他们到他的家里跟他的老板贝索斯见面,当他们解释了为什么永远都不会在首页上放置展示广告时,贝索斯对Page和Brin的热情和“健康的倔强”感到着迷。然后贝索斯也加入了Bechtolsheim、Cheriton以及Shriram的行列,总共为Google投入了一百万美元的天使资金。

1998年9月4日,Page和Brin正式申请注册公司,并最终把公司搬离了学校。Sergey当时的女友与英特尔一位叫做Susan Wojcicki(现为YouTube CEO)的经理相处融洽,后者刚刚跟丈夫以61.5万美元的价格在Menlo Park的Santa Margarita大街上买了一栋房子。为了帮助偿还抵押贷款,这对夫妇以1700美元的月租把车库和几间房租给了Google。那时候,他们还雇用了自己的第一位员工,斯坦福大学学生Craig Silverstein。他的敲门砖是一个压缩算法,通过展示将爬取的链接压缩起来放进内存,让搜索跑得更快,从而打动了两位创始人。他们还招来一位办公室经理。但是,仿佛是为了那博士学位来对冲(开公司的风险)一样,他们仍维持在斯坦福大学的存在。那年秋天,两人共同开设了课程CS 349,也就是“数据挖掘、搜索与万维网”,那学期是每周开两次课。Brin和Page宣布该门课程属于“项目课”,学生将要在课程中处理他们已经捕捉到的2500万个网页(现在已成为一家私营公司的资料库一部分)他们甚至配备了一名研究助理。学生最开始的阅读作业之一就是要去看他们两位的论文,但学期后半段时,他们又专门讲了PageRank和Kleinberg的工作。

那年的十二月,在最后一批项目到期后,Page通过电子邮件向学生发出了一封具有里程碑标志的派对邀请,上面写着:“斯坦福的研究项目现在已成Google.com:下一代的互联网搜索公司。”

译者:boxi。

打开APP阅读更多精彩内容