在数据混不进IT鄙视链的年代
他决定一生ALL IN
科创人(以下简科):您认为自己人生中第一个重要的节点是?
郭炜(以下简称郭):是我大三的时候。我从小学计算机,很早就接触了代码和编程,到了大学就开始思考,学来的技能将来到底能做什么?语言、代码,从basic、pascal、c语言、java……一直都在变化,将来一定还会有新的语言出现。我思考的是,IT技术领域究竟什么是不变的?当时尝试了挺多方向,大学里有各种实验室,网络实验室、数据库实验室、研究芯片的体系结构实验室等等吧,我发现真正不变的只有数据。于是大三那年下决心加入了数据库实验室,本科毕业论文写的就是数据挖掘。
科:您对数据最初的理解是?
郭:那时候触达的层面还是数据库、数据源组、数据关系,事实上任何客观存在都可以被抽象成数据,语言、技术不停在变,但数据相对不变,这让我觉得是一个可以长远做下去的事。尽管当年还没有哲学高度的理解,可我已经对数据入了迷,研究生也没犹豫地选择了数据相关的专业。
科:2002年就有数据专业研究生?
郭:真没有(笑),那时候还叫信息与信号处理,其实是数据挖掘、模式识别。最早数据挖掘是叫Data Miner,中文叫数据矿工,出门跟人聊天人家总问你是挖什么东西的?解释还挺麻烦,只能说不是挖煤的。
科:当年数据专业算是IT圈鄙视链靠末端的?
郭:压根都进不到鄙视链里面(笑),即便是IT圈内大家也不知道我们是干什么的,“做数据的?Oracle?”都是这种反应。闷头做事呗,大学参与了当年中国最大的数据仓库项目,中国移动规划建设的,我参与了中移动经营分析系统的系统规范编写,包括1.0、1.2、1.5。这是国内最早做BI、数据挖掘的项目,我的毕业论文《过程神经网络的客户流失分析》就是用山东省移动的实际数据验证跑出来的,效果比SAS的客户流失分析要更好一些,拿了优秀论文。
回想下,那时候做数据工作受到数据采集的制约很大,现在有智能的IoT设备、有人脸识别这类计算机视觉,当年只能基于传统的数据仓库做一些事情,比如消费者划卡买了哪些东西。可这就足够有趣了,以至于我早早就产生了一个信念,在很多场合也提过,“数据是有灵魂的,我将用一生去追寻它”。
2
因啤酒尿布加入Teradata
在行业波谷选择坚持信念
科:您毕业后选择工作的标准是什么?
郭:数据挖掘这个词的创造者是韩家炜老师,在他的课上接触到了啤酒尿布(注1)的案例,觉得太有趣了,于是毕业后就进到缔造了啤酒尿布案例的大数据公司Teradata,做数据架构师,作为项目经理参加内蒙古移动数据仓库建设。在内蒙古工作的那段时间让人印象深刻,冬天零下三四十度,沙尘暴的时候沙子能把脸刮出血来,出门就得从头到脚全副武装。
注1:啤酒尿布的故事
版本诸多,传播最广的是沃尔玛版,相对真实可信的版本是:1992年,Teradata(当时还是NCR)团队找上美国连锁零售店Osco Drug,取得了25家分店90天共1200万笔的POS数据,分析发现20多种商品有特殊关联性,其中一项是每天下午5点至7点,许多顾客的购物篮内都买了啤酒与尿布(其他还包括“咳嗽糖浆跟果汁”等)。
科:听上去比一般IT从业者辛苦很多,有没有想过放弃?
郭:其实当年很多做数据工作的同学、同事都转行了,不过不是因为艰苦。2000年~2005年是数据行业的一个热度高峰,BI、数据挖掘等等都是热门,但一些企业投入大量资金后发现BI的闭环比较长,并不完美,于是整个数据行业慢慢由热转冷,从业者的收入和上升空间都受到了影响,我还真是靠着信念才坚持下来的。从Teradata去到IBM,这些都是BI、数据挖掘的专业厂商,但当时明显能感觉到因为投入减少,迭代速度放慢,大量工作是重复、低效、缺乏创新的。这样的工作很难做出突破,思前想后,选择去企业端看一看,就去了中金。
科:您是从什么时候开始参与到管理工作的?
郭:Teradata期间第一次尝试PM工作,毕竟个人的技术能力有天花板,有些事搞不定。最初以为做管理是做设计,结果发现最重要的管理技能是沟通,当时吃了一个大亏,项目本身没有什么难度,但做出来之后发现,原来提需求的人未必是真正的最终用户,按照需求做的项目被真正的使用者痛批一顿。那时候意识到,做项目管理一定要穿透现象,看到需求的本质。还有,我强烈推荐大家学习PMP。
3
巧妇难为无数之炊
推进亿元级项目累并快乐着
科:您为何选择去中金?
郭:因为许多新的科技、尤其是数据技术,会率先在投行实现应用,它离钱最近,数据跟钱有一种天生的缘分。
科:从数据专业公司到企业,适应起来有没有遇到麻烦事?
郭:Teradata、IBM这类专业性强的企业工作的时候,项目和工作范围都被定义好了,你只需要做。但是在企业不一样,我到了中金一看,情况是两个极端:交易这部分,一位剑桥的天才少年博士带着做模型分析,特别强悍;但内部管理,什么都没有,所以我在中金的第一个工作是ERP,先得把数据拿到手。直到现在我对应收、应付、人力这些都还挺熟的(笑)。当年很多投行都没有完成电子化,说实话人家确实也没有那么需要,单子+excel基本就能搞定——一开始还觉得这有点落后,可现在我觉得无招胜有招,excel还是非常强大的工具。
Tips-郭炜谈excel
所见即所得,普通财务人员都能用得非常好,不仅是数据平民化的好工具,还支持数据挖掘算法,可以连数据库、图标展示、利用插件实现复杂功能……功能十分强大,就看怎么用。
工具不必追新,关键在思维,能在数据思维引导下解决问题的工具就是好工具。
科:除了推动电子化,您在中金做了哪些跟数据相关的工作?
郭:先是做数据规整,把彭博、路透的数据接进来,然后做历史分析、计算风险敞口。2010年开始做了一个很先进的东西,网络金融,整套系统全部做出来了,网上开户、网络交易……没想到合规审查没有通过。拖了很久,耗时一年多的工作成果闲置在那,团队也不知道做什么,正好万达提供了一个非常好的机会,万达那边业态多、数据也多,我觉得一定会很好玩。
科:万达的商业数据能用来做什么?
郭:WiFi定位,就是通过智能POS刷卡信息、停车信息、智能WiFi记录移动轨迹等数据,之后将数据全部打通,分析消费者在万达广场内的行为,以便优化服务。
万达是真有钱,整个项目下来1.03个亿,光厂商招了20多个,都是世界顶级的供应商:思科、Aruba、Moto……圈在大连万达广场某个办公室封闭开发。万达WiFi定位项目在全球范围内都是领先的,这些供应商有技术但没有现成的产品,他们的工程师也很兴奋,闷头做了3个多月,做出了一个三点定位系统。
这个项目对我来说收获巨大,不仅自己在圈内开始有了点名气,还让我意识到数据已经从线上的点迹流进化到了线下的行为分析流,视野开阔多了。
科:在1亿元规模的项目里扮演重要角色是怎样一种体验?
郭:万达的管理非常严格,到时间交结果,经常下飞机奔现场搞测试忙到第二天天亮。严格管理的优势显而易见,我们最初在4个万达广场搞测试,成功之后只用了半年时间,全国所有万达广场全部上线,这个效率很可怕,当然预算充足也很重要。
也碰到过问题,还是沟通,让我更加深刻地意识到沟通是管理工作的重中之重。尽管万达是自上而下推进项目,但我还是需要与各个部门、各个广场负责人说明这个事是什么、为什么做,不然对方的配合程度就会有差,他们总问为什么要把数据给你?
4
最大困局因心太软
管理=两翔相权取其轻
科:您和易观结缘,数据专家加入老牌数据公司,有没有如鱼得水的感觉?
郭:易观创始人于扬于总希望我来做产品和技术赋能,易观作为一家老牌的数据公司,能够十几年坚持着做数据这件事,让我心生敬意,决定来试试。
到了这才发现,为什么说创业是九死一生。创业曲线一开始都很高昂,人人觉得大有可为,推进过程中逐渐发现现实残酷,这不算完,再走一段必然有一个更深的坑等着。我刚来易观的时候这边已经有20多人的团队了,心说不错啊,小伙子们都挺可爱的。最早做的项目是易观千帆,分析移动APP数据的,主要技术功能是采集数据,那就做吧,结果BUG这个多啊,经常数据库半夜挂了,还有一些说都说不清的问题。那段时间又开始熬夜通宵,我辛苦团队也很辛苦,老板也吐槽,说你来了几个月了,这情况,是吧……
结果,到底是出了一个重大事故,接收端出现数据拥堵导致雪崩,团队改了三天愣是没搞定。我记得特别清楚,2016年生日那天老板找我,没骂人,说完“生日快乐”接着就是“感谢你这段时间的工作”(笑)。难受啊,这生日过的,但斗志也激出来了,我没有一次换工作是因为搞不定技术问题,走也必须解决了问题再走。经过仔细思考、反复推敲,我想出来现在易观大数据“云+端”的控制计算逻辑,现学了当时用的技术语言Lua,用一天敲了一段代码实现了雏形、上线,世界安静了,问题解决了。
科:一边觉得很牛一边又觉得CTO敲代码画风凄凉……
郭:CTO么,技术方面到最后搞不定的事情你就要上,不管是写代码还是搞定技术用户,因为你身后再也没有人了,你就是公司技术最后一道保险。经过了这个事,技术圈里的一个好朋友跟我说,别心软,整个团队优化了吧,你填坑的速度肯定没有他们挖坑的速度快,我一想也是,不下决心不行了。后来我在做分享的时候说过“做CTO要有匪气,要心狠一点”,其实就是这件事吸取的教训。
挺多朋友问我CTO工作重点到底是什么,我说最重要的工作是找人,像泡妞一样泡人才,好的人才HR可能招不来,必须boss直聘(并非植入广告)。CTO还要负责建立文化体系,100人以上的团队你根本不可能知道每个员工在干嘛,需要用文化和价值观去引领、匡正。
科:似乎那一次难题让您完成了一次精神上的蜕变?
郭:之后其实也有挑战,但都是可预期的,有坑就早填、有雷就早排,新产品线的挑战、是否开源的纠结……压力和困难永远都会有,但自己对事情的控制力还是增强了不少。
还是要说,做CTO需要抗压能力,公司里懂技术的人不多,很多问题都能朝技术团队甩锅,而你作为技术团队的领导者无路可退,身后就是袍泽弟兄,必须要撑得住、处理得好。大部分时候技术管理者面临的问题,不是两利相权取其重,而是两坨翔,一坨大一坨更大,你吃不吃,不吃立刻翻一倍,迟早必须吃,吃完还要笑眯眯的给团队传递正能量,让大家安心冲。
现在团队100多人了,和团队一起将自己开源的项目Dolphin Scheduler成功进入了Apache基金会,易观成为了BATJ之外唯一一个中国非大厂开源项目入选Apache基金的公司。