一个城市的信仰

淘宝数据掌门人汪海

淘宝数据掌门人汪海

2001年,凭着平均60几分的成绩和东拼西凑的毕业设计,汪海从一所非著名大学非计算机类专业毕业,后来,他拥有了ORACLE全球ACE、2008年ORACLE MAGAZINE全球年度IT MANAGER等常人难以企及的荣誉。2003年,他本来打算到当时名不见经传的淘宝随便呆几个月就去出国留学,但个性喜欢挑战的他因为在淘宝感到“非常非常辛苦和非常非常快乐”,而一呆就已经是6年多。如今,淘宝已成了国内网购行业的老大,他也成了淘宝数据平台的掌门人。

汪海在淘宝的花名叫七公。在小说里,七公统领的丐帮是天下第一大帮派;在现实中,汪海领衔的淘宝数据平台,也有着中国最庞大的数据资源。不管是单个的丐帮帮众还是单独的数据,作为个体他们并不起眼,但众多个体在领头人带领下汇集在一起之后,其力量真正是“随便跺下脚,整个武林都会晃荡。”

3月31日,淘宝举行“淘宝向全球开放数据”发布会,正式推出开放数据的第一个产品:数据魔方。作为淘宝数据平台的老大,汪海的发言主题为“数据之美”。解读数据之美正是这位淘宝七公的日常工作。

领衔淘宝数据平台

“云计算是我最新的挑战”

“淘宝的数据是海量的,也是难以分析的,然而它对整个电子商务领域具有非常重大的意义。随着信息量的不断增长,数据应该通过怎样的方式去感受?”汪海打了个比方,“惯常的,我们会用表格,以及图表去解读。但一旦涉及到信息量很大的时候,这些远远不够。而淘宝数据云组成的超级计算机可以在最短的时间生产出直接使用的商业数据,并且利用更直观的可视化图像为企业解读,帮助企业完成商业决策。”

普遍认为,淘宝后台积累且不断膨胀的海量数据是一座庞大到令人瞠目的资源富矿,不管是对消费者、经营者还是研究者等等都极有价值,汪海正是这些海量数据的牧者。随着淘宝数据魔方的推出和淘宝数据开放战略的深入,将会有很多电子商务企业能够通过分享淘宝发布的数据而受益。然而汪海强调,数据魔方的推出只是淘宝数据开放的一个小水花,将来会有越来越多的开放政策,直至会变成大海。

未来十年要“变成大海”,淘宝的数据开放还有很多事情需要去完成。“从技术的角度来说,解读淘宝海量的数据规模,它是需要一个极大的云计算平台去支撑,”汪海认为,“这是未来十年整个技术领域最具挑战性的部分。”

淘宝数据规模大到怎样的程度?汪海形容,处理淘宝的数据绝对称得上是一个世界性的技术难题,那种真正架构过淘宝十分之一的规模大系统的人,就可以称为中国顶尖的专家。随着淘宝数据的不断增长,可能到今年年底,淘宝整个的数据就会有10个PB。极快的增长速度意味着,整个技术架构也需要做到日新月异。

“说得直白一点,为什么要云计算,现在淘宝数据计算的挑战,就像20年前给你一台60M硬盘、8M内存的286去处理100G的数据,你根本没有办法在单机或者小规模的集群去实现这样的计算。云计算并不是一个虚无缥渺的概念,当你真正要面对这么多数据需要处理的时候,你才会真正理解云计算的意义。要涉及到用一万台服务器来并发计算极其复杂的应用时,你怎么能保证这些机器能够一起使劲,怎么能让100台服务器断电了也不会影响整体运算,怎么让程序员不需要写复杂的并行算法就可以实现分布式并行计算,这些都是云计算平台需要解决的问题。怎样均衡的分布数据,怎样协调各个服务器之间的网络,怎么高效的去协调各个机器的进程和资源,都是一件极其复杂的事情。编程的人都知道,仅仅在单机上协调多进程、多线程的关系就是一件复杂的事情,一旦你要在一个跨机器、跨机房的分布式环境去实现这样的一个目标,这更是非常有挑战性的一个东西。”

从后进生到大拿

“我对自己没限制”

与谈到淘宝数据时的滔滔不绝相反,给出3分钟时间,汪海甚至也想不出目前的经历中最能给他带来成就感的事情是什么。不管是2008年ORACLE MAGAZINE全球年度IT MANAGER还是入手不久的宝马汽车,他觉得都不算什么。他个性喜欢挑战从不服输,在做过的每块领域几乎都达到专业水准,但硬币的另一面,他只像是一个既不热衷规划、对已经达成的目标也没什么感觉,同时又相当懒散的游戏宅男。他的关注点不在过去而在于未来,不在成绩而在于挑战,“数据会成为淘宝未来非常核心的部分,这也就是我的下一个目标。”

比起那些从小痴迷编程的IT狂人,他坦言自己目前从事这行属于歪打正着。2001年大学毕业后,对计算机的了解大多还局限于游戏的他用朋友做的一个小程序换到了一个程序员的工作。两天后,老板识破了他的专业水平,他被辞退了。

不过从此他跟计算机技术较上劲了。两年后,他离开了第二份工作,这次不是因为技术能力不够,而是那份工作已经没有任何难度挑战,“只有我教别人的份,没有别人教我的份了”。失去了挑战目标的汪海一时也失去了方向,玩游戏、泡论坛成了主要工作,凭着专业能力还在CSDN论坛一个老手那里抢了个版主来当。“特别值得一提的是当时鲁国良搞的oracle论坛CNOUG,学术气氛非常浓,大家提的都是那种最难的问题,然后自己去思考,而不只是单单解决问题这么简单,”汪海说,“在那里我的提高非常快,现在阿里系里面的技术牛人包括鲁国良、冯大辉、冯春培、陈吉平他们当时也都在里面,也正因为鲁国良,在我犹豫是否要出国留学的时候到了淘宝。”

“我对自己没有任何限制,”汪海说。汪海在淘宝最早的目标是成为一个很好的DBA,但事实上后来他不仅做DBA,后来做基础架构,运维也做过,开发也做过,现在带数据平台产品,里面涉及的东西更多了,“新的挑战可能更多是技术以外的东西了。”

在淘宝拥抱变化

“本来只打算呆几个月”

到淘宝的时候,汪海已经是一个很全面的技术专家了,不过淘宝能给他的显然更多。他在淘宝做过很多职位,这也许是他改变计划在淘宝工作至今的重要原因——每一次职位的变换都是一次新的挑战,而挑战也许是这个世界上最能令他兴奋的东西。

2003年的淘宝刚处于初创阶段,工作非常多人也非常累,公司虽然没什么条条框框的规定,但几乎每个人每天上班都在12小时以上,一周一般都要上六天。“进去当天觉得不对,但当晚工作到10点多回家的时候感觉还挺好的,非常非常辛苦,但也非常非常快乐。最惨的一次在机房连续五天,连家都没回去过,后来星期六下午终于把这个弄完了,然后回家一躺到床上到第二天中午才醒来。那段时间真的非常非常辛苦,但是我又觉得没有任何不爽。”

汪海就这样在淘宝呆下来了,一晃就是6年多。“我这个人比较容易接受变化,觉得任何变化都是一种财富,一旦适应了这种变化就具备了你可以处理这种事情的能力。”这可能是汪海后来一直呆在淘宝的原因,“拥抱变化”是淘宝的六大价值观之一,这里永远都不缺乏变化。“淘宝有很多的工种可以换,所以还是有很大的空间在里面。”汪海拿自己举例说,“每一次换工种就会遇到一个新领域,你会觉得随着在这些领域每一次技术的改造,自己的眼界越来越宽,最后你会发现你的眼界是跟全球同步的。”

“淘宝目前的发展程度其实是可以代表互联网的,如果在淘宝学不到东西,再去别的公司也学不到东西了,比如云计算,”汪海说,“你只有在像淘宝这样的企业才会接触到。”

寄语技术新人

作为新人一定要谦虚。年轻人有激情又冲劲,是优势。但冲劲的另一面是冲动,好高骛远。其实很多事情关键是要有行动,少空谈,多干实事。需要新人能够放低姿态,用空杯心态去学习。

学会忍耐,耐得住寂寞。作为技术人员,做的都是些幕后工作。我特别推崇我的同事,淘宝首席技术专家蔡景现,身上有一种很特别的特质,我们都评价他为机器人,整天坐在电脑面前,就是不离开电脑,手不离电脑,一天到晚也不跟别人说话,就是因为他能耐的住寂寞和枯燥,才能独立思考,成为行业内有影响力的人。

培养开放和分享的心态。在一个高科技公司,如果抱着保守和封闭的心态,成长肯定受阻。关键是能够以开放心态,积极分享自己的绝招。与交换苹果不同,通过思想的分享和交换,你将获得更多。

要学会利用公司资源。作为新人,要善于在工作中挖掘资源。比如,淘宝是一个高速发展的公司,在这么一个急剧变化的体系里面,你可以有很多的工种可以换,你可以和个方面的优秀人才合作,你永远觉得你要学的东西是学不完的,你需要的提升是无穷的。

赞(0) 打赏
未经允许不得转载:东东博客 » 淘宝数据掌门人汪海

评论 抢沙发