随波而逝的巨星Jim Gray
扫描二维码
随时随地手机看文章
1990年代初,微软计划进入企业数据库市场,开始给圈内的高手打电话挖角时,发现所有人都会提及一个名字,更令人惊讶的是,所有人都会说这个人比我更强,或者他已给我打过电话谈论此事。
这个奇人,就是Jim Gray。1998年,他因为数据库尤其是事务处理方面的开创性贡献而获得图灵奖。
1944年1月12日,Jim Gray生于美国旧金山一个普通人家,母亲是教师,父亲在军队服役。大概七岁时父母离异。因为家里穷,1961年Gray选择进入公立的加州大学伯克利分校就读。第一学年他曾因化学成绩糟糕一度放弃学业,跑到General Dynamics做实习生。六个月后对公司感到厌倦回到校园时,他选择了数值分析、离散数学等很多计算机方面的课程,凭借不错的数学功底,他开始如鱼得水,最后以优异成绩毕业,获得了数学和工程双学位。
之后Gray曾短时在贝尔实验室工作,参与过Multics项目,与Ken Thompson共事。很快他又返回伯克利,只用了三年就拿下该校历史上第一个计算机博士学位。期间对他后来学术影响较大的是,与一组同事一起将计算机科学应用于社会问题研究,比如失业、城市规划等。现在看来,这正是大数据的萌芽。
1969年博士毕业后,他在IBM研究院工作了十年。期间最著名的工作是参与了Edgar Codd和Don Chamberlin等在关系型数据库、SQL上的开拓性研究与实现。但实际上RISC之父John Cocke对他的影响最大。在1971年,Cocke和他已经在研究可以无限灵活扩展的架构(云计算!)。这使Gray能在当时争论纷繁的数据库学术大战中独辟蹊径,转向底层,同时思考各种数据库都面临的并发和故障恢复等基本问题,厘清了事务的基本概念以及现在已经成为常识的ACID属性,并给出了许多具体的实现机制。今天,所有电子化的商业和金融系统的可靠运作都离不开Gray的成就。
此后他先后在Tandem和DEC从事软件研发工作,并在事务和数据库性能、分布式系统等方面继续取得诸多研究成果。1995年,微软为了将其罗致帐下,首次在总部之外开设研究院。而在微软研究院宽松的环境下,他主持和推动的许多项目都极具科幻色彩,致力于应用计算机海量数据处理技术解决各科学领域的问题。2009年出版的《第四范式:数据密集的科学发现》一书是他这一思想的绝佳体现。他是大数据浪潮当之无愧的先驱。
不幸的是,2007年1月28日,喜爱户外运动的Jim Gray独自驾船在海上失踪。消息传来,彼此竞争的各大公司、无数爱戴着他的同行和门生都行动起来,将搜寻变成了一个大型的社区协作科研项目,并让全世界网友也能参与进来,还获得了不少学术成果,情景非常感人。只不过,这些努力最后并没有召回这位天才。
有才之人一般不易相处,但Jim Gray却是个大大的例外。他有着神奇的魅力和精力,在为数不多的时间内,全身心地倾听他人的诉求,给予点石成金般的指点和帮助,往往从此改变对方的一生。他热心审读大量各种领域的技术论文,给出自己的权威评论,还坚持给众多同行发送有价值的论文或者研究成果。正因为如此,在技术界竟然有成百上千人认为Gray是自己亲密的朋友或者导师。
仅仅数据库专家这个评价,完全不足以概括他多方面的成就和广泛的影响。Sendmail开发者Eric Allman说,Gray学识极为渊博,几乎知道任何事情,是堪与图灵、Dijkstra相提并论的计算机科学超级巨星。Gray的图灵奖演讲纵横捭阖,视野开阔,充分体现了这一点。曾任微软CTO的Vaskevitch认为Gray的最大贡献在于几十年不知疲倦地通过无私培养、提携和学术合作,影响和连接着成千上万的同行,跨越了公司的界限,帮助塑造了整个计算机科学社区。而Gray倡导的eScience理念则将这种影响扩大到更多科学领域。
需要过多少年,才会再出现一个Jim Gray?