首页 > 范文大全 > 正文

谷歌与云智慧

开篇:润墨网以专业的文秘视角,为您筛选了一篇谷歌与云智慧范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

27岁的Christophe Bisciglia是谷歌的高级软件工程师。对那些信心十足来谷歌求职的大学生,他每次都问同样的一个简单问题,以判断他们是否有谷歌人的思维方式。“告诉我,如果面对的数据是现在的一千倍,你怎么办?”多么奇怪的问题。如果这是在学校里做毕业设计,大学生们会用一大堆公式来对付这么庞大的数据,他们学校的服务器肯定会因此而像爬虫一样缓慢。

Bisciglia这样解释他的问题。要在谷歌生存,大学生们必须有更广阔的视野。他向应聘者介绍谷歌遍布全球的电脑网络。这个网络即时回答着用户的搜索。但同时它们还能快速掠过数据的海洋,以比地球上任何机器都要快的速度寻找答案或资讯。这个网络的硬件大部分分布在谷歌总部之外的几个大型数据中心。人们称之为“云”。谷歌编程的一个挑战就是撬动这片“云”,让它完成少数计算机无法胜任的任务。谷歌的新员工通常要用几个月的时间才能有这种大的视野:如果有人提出要搞一个需要几千台机器一起运作的大项目,那就表明他已经学会了谷歌人的思维方式。

Bisciglia 认为,谷歌新员工最需要的是岗前培训。一年前的一天,他在会议期间遇上了谷歌的首席执行官Eric E. Schmidt,他的脑海里突然冒出了一个想法。谷歌人都有一定的时间从事独立项目。他要用这个时间的五分之一来开设一门课程。 这门课程将向他的母校华盛顿大学的学生讲授云计算的知识。这门课程就叫做谷歌101。Schmidt喜欢这个计划。几个月后,Bisciglia的谷歌101 课程就会开展起来。它将与IBM一道把世界上的大学连接在一起,组成谷歌这样的云计算网络。

这个计划将把谷歌的脚印扩展到搜索、媒体和广告之外,把这个巨人引向科学研究,或带进一个新的商业领域。从某种意义上说,谷歌就是世界最重要的计算机。

“我本来以为Bisciglia要去从事教育事业,那也挺好。”一天下午在谷歌总部,Schmidt 这样说:“可是九个月后,他发表了这个新的云战略,这是完全出乎我的意料的。这个云战略向学生、研究人员和企业家们表明了谷歌在数据处理方面的巨大能力。”

什么是谷歌的云呢?它是一个由成千上万甚或一百万台低廉的服务器组成的网络,每一个服务器都与我们家里的电脑没有什么两样。它储存着数量惊人的数据,包括万维网的无数备份。这使搜索更快捷,使用户可以在几十亿词条中很快搜索到想要的内容。与传统的超级计算机不同的是,谷歌系统永远不会老化。当某一部分寿命用完,通常是在三年之后,工程师把它们拔掉换上新的更快的机器就行了。这意味着云计算在发展中可以再生,几乎就像生物一样。

在云计算方面的进展标志着人类在信息处理方式上有了根本的转变。谷歌的主管们很早就为这个转变进行了设想和准备。以谷歌为中心的云计算非常符合这个公司的伟大前景。 它是Sergey Brin 和Larry Page在十年前建立起来的,目的是为了把世界上的信息组织起来,让全球的人都能使用它们。Bisciglia的想法为这个目的的实现开辟了道路。“也许那时他已经在脑海里有了这个想法,没有告诉我,” Schmidt说,“我没有意识到他想改变计算机科学家们对计算的认识方式。这是一个雄心勃勃的目标。”

单行道

对于小公司和企业家们来说,云计算意味着机会。到目前为止,只有一部分使用了云计算技术的互联网大公司才有能力收集和处理巨大的信息资源,并以此为基础赚钱。我们的语言、照片、点击和搜索是这个产业的原材料。不过这个产业很大程度上只是一条单行道。人类产生数据,谷歌、雅虎和亚马逊这样的大公司把这些信息转化为思想、服务,最终转化为收入。

云计算网络将会发展到多大规模呢?“没有止境,”Schmidt说。随着这些战略的展开,更多的人们开始认识到,在计算处理的下一个阶段,谷歌正准备成为一个主导力量。“谷歌意欲成为这个你每天都要访问的云计算网络的大部分。”这位执行官说。到现在为止,谷歌仍然致力于那给它带来大量广告收入的核心业务。从投资的角度来讲,云计算的开发几乎还算不上一个目标。它盘旋在遥远的未来,大而模糊,还不能连成一片,但它就在远处,闪耀着机会之光。

谷歌是一个到处都是博士的地方。与他的很多谷歌同事不同的是,Bisciglia刚从华盛顿大学毕业就被公司挖了进来,他从来都没有读过研究生。因此,他非常渴望能够从谷歌的日常事务中暂时脱离出来。“我非常想去教学,”他说。

在与谷歌首席执行官详细讨论他的想法之前,他没有多想。Bisciglia和Schmidt 相互认识已有多年。五年前Bisciglia作为一个22岁的程序员刚刚进入谷歌的时候,就在首席执行官的办公室对面上班。他说,他会散着步走进来,部分地是因为那个飞机模型吸引了他的注意,让他想起在美联航做空姐的母亲。他与和声细语的首席执行官自然地谈论着计算的问题。几乎就像是在大学里一样。即使后来他搬到了别的大楼,他们两个人仍然保持着联系。(“他从来都不是那种拒人于千里之外的人。他在回复电邮方面快得让人难以置信,”Bisciglia说。)

他们第一次讨论谷歌101课程的那天,Schmidt给他提了一个建议:把项目缩小到能够在两个月内完成。“我当时实际上并没有留意他做的事。”Schmidt回忆道。但是他要这位年轻的工程师尽快做决定。即使Bisciglia失败了,他说:“他很聪明,会从中学到东西的。”

为了开设谷歌101课程,Bisciglia不得不涉及动力学和谷歌云计算的一些知识――但是没有深入讲解云计算的知识,也没有揭示云计算的深奥之处。这些深奥之处在计算机科学家当中引起了无穷的思考。但是谷歌仍然没有揭开它的神秘面纱。毕竟这个巨大的计算机是公司的命脉。它自动处理着搜索内容、广告和邮件。这个计算机做着这些工作,而成千上万包括Bisciglia在内的谷歌工程师仅仅是为这台计算机服务。他们教这个系统新的把戏,或者为它找到新的市场。他们为它增加新的集群――单是今年就增加了四个新的数据中心,平均每个数据中心花费600万美元。谷歌一向以搜索引擎闻名,但是在这台机器的建设上,谷歌准备在计算机产业中发挥新的作用。

Bisciglia的学生们将以何种方式访问这台机器呢?最容易的方法就是直接把课堂与谷歌计算机连接起来。不过谷歌公司不会让学生们自由访问一台满是公司软件和个人资料,运营着16亿生意的电脑的。因此Bisciglia购买了一个由40台电脑组成的集群。他下了一个定单,然后开始考虑如何支付服务器的费用。在卖主把电脑连接到一起的同时,他提醒谷歌的经理们来了一个定单。然后他“好心地把预算报告报了上去,没有人说不行。”他接着说出了他最喜欢的一句名言:“请求别人原谅总比请求别人批准要容易。”

狂热的学习者

2006年11月10日,计算机的机架出现在华盛顿大学计算机科学院的大楼里。Bisciglia和几个技术管理员必须考虑如何将一吨重的机架运到四层的服务器房间里。最后他们还是想办法做到了,然后就筹备计划在一月份开讲的课程了。

2006年下半年,Bisciglia往来于谷歌大楼和西雅图之间,筹备谷歌101课程。他用企业家的技巧把一支由自由散漫的志愿者队伍凝聚到一起。他与学院里的实习教师一起备课,他从附近的Kirkland强拉了几个谷歌的同事来帮忙,要求他们拿出五分之一的时间来帮助他教学。Bisciglia 听从了Schmidt 的建议,把谷歌101课程集中到学生能够很快掌握的的内容。“什么事情是我能够在两个月内教会他们,而又对他们有用, 而且真的很重要呢?”他的答案是“MapReduce” (Google开发的C++编程工具,用于大规模数据集群的并行运算。)

Bisciglia 很喜欢MapReduce。这个软件是谷歌计算处理的心脏。在公司著名的搜索十进位法则为每一次搜索提供资讯的同时,MapReduce 带来的是速度和产业的重要性。它把每一次任务划分为几百个任务,甚至数千个任务,然后分配给很多计算机。在不到一秒的时间里,每一台计算机都反馈回一点信息,MapReduce 快速把这些反应集合成为一个答案。有些程序也有同样的作用,但是MapReduce更快,似乎能够处理各种各样的工作。Bisciglia 称赞道:“我毕业后来到谷歌,就开始学习MapReduce,它真的改变了我对计算机科学和一切事情的看法。”他称之为“一个很简单很精致的模型。”它的开发者Jeffrey Dean也是华盛顿大学的毕业生。通过回到华盛顿大学和教学生学习MapReduce,Bisciglia将把这个软件和这种思维方式带回了它的发源地。

这里有一个障碍。MapReduce 被安装在谷歌的计算机里――外面的用户没有办法使用它,即使是谷歌101课程也不例外。谷歌确实共享了某些相关信息来充实MapReduce的公开版本Hadoop。但谷歌的指导思想是在不泄露它的核心技术的前提下,推行它的标准,使之成为云计算处理体系的标准。Hadoop 仍然是开源软件,这意味着谷歌的员工可以免费改编并把它安装到华盛顿大学的集群上。

谷歌101课程一出现在冬季学期的教学大纲里,学生们就纷纷来注册。开始时,Bisciglia 和他的谷歌同事尝试着自己教。但不久他们就把这个工作交给华盛顿大学的职业教师们。“他们讲得更明白。”Bisciglia 说。在几个周的时间里,学生们已经学会了为谷歌计算机设定任务,设计野心勃勃的网页项目了。从在维基百科大全上为编辑工作编目,到浏览网页上识别垃圾邮件。2007年春天的课程一结束,谷歌101课程的口碑不胫而走,其他学校和院系也开始要求在他们那里开课了。

很多人想要了解云的秘诀和计算处理的威力――特别是云计算对于科学研究的作用。在每一个特定的领域,传感器、分析设备和最精细的测量工具收集到大量新的数据,科学家们就挣扎在这些数据之中。从这些数据中发现的模式可能赋予研究以重大的意义。然而大多数科学家都没有储存和详细审查这些数字珍宝的计算机。我们正被淹没在数据之中。

云计算的发展与前景

对谷歌计算处理系统的渴望让Bisciglia陷入困境。他曾经成功地推动了第一个计算机集群的购买。他不可能用同样的方法在每一个计算机科学系都安装一个小型的谷歌集群。为了把谷歌101课程推广到全世界的所有大学,参与者需要接入共享的资源。Bisciglia需要一个更大型的云。

这就是幸运降临到谷歌总部、降临到的IBM 主席Samuel J. Palmisano身上的时刻。这是“谷歌的庆祝日”,IBM的一位研究人员这样说。这个冬日的校园有点冷,不大适宜在校园里打沙滩排球。但是Palmisano 在一个咖啡店里吃了一些免费的小吃作为午餐。接着,他和他的员工与Schmidt 和Bisciglia等几个谷歌人坐了下来。他们使用白板,就云计算的问题展开了讨论。人人都知道IBM想要配置云计算网络,从而可以向他们的商业用户提供数据和服务。同时,在Palmisano的领导下,IBM已经成为开放源代码软件包括Linux软件的主要倡导者。如果谷歌和IBM结合起来进行云的冒险,它们能够创立谷歌进行云计算的标准。

当然,谷歌在这样一个项目上有一个起跑点,那就是Bisciglia的谷歌101课程。一天,在课堂上, Bisciglia的小小的冒险得到了两个科技巨人的支持。那天下午在Palmisano离开之前,他们决定,Bisciglia和IBM 的Dennis Quan将一起建立一个谷歌――IBM大学云的原型。

接下来的三个周,他们一起在谷歌总部工作。大约就是在这个时候, Bisciglia说, 他将把全部时间投入云工程,而不是原来的20%。这个工作需要整合IBM的商业应用软件和谷歌的服务器,并装备大量的开放源代码的程序,包括Hadoop软件。二月份,他们在加里福尼亚的山景中为商界的要人们展示了这个原型,在纽约为其他来自IBM总部的人放映了录象,Quan 演示了把从云的原型下载数据到他的手机上,这让观众大为赞叹。

谷歌101课程一路畅通。这个计划是在一年内把云计算扩展到美国的少数大学,然后再推广到全球。大学应该开发云,创造工具和应用软件,同时培养大量的计算机科学家来继续云的建设和管理。

随着商业和科学数据的增加,计算能力将成为一种战略资源,一种资本。“从某种意义上说,这个地球上只有五台计算机。它们是谷歌、雅虎、微软、IBM和亚马逊。其他计算机没有能力把电转化成为高效率的计算能力。”雅虎的研究主管Prabhakar Raghavan这样说。

未来的云计算将像巨大的虚拟实验室一样发挥作用,有新一代的图书管理员对储存的数据进行分类,以适当的证书向研究者开放。获得授权的用户将创造新的工具,添加新的数据,并与分布各处的同事分享。在这些新的实验室中,通过分析别人收集的数据,你甚至可以获得诺贝尔奖。商业和科学的融合将在短短的几年里带来很需要想象力的云计算网络。与云计算网络相比,互联网是微不足道的。但是,如果这个渺小的网络大到能够产生谷歌和它的帝国,那么这个巨大的云将带来无限的可能性。

值得一提的是,2007年11月中旬,Christophe Bisciglia到中国来了。他向中国的大学介绍了他的谷歌101课程。