近几年大数据与人工智能火了,大数据技术带来了一场革命性的创新,但是当我们把这些技术发展的逻辑梳理一下,就会发现,这一切的目的最终是让数据告诉公司怎样做才能更赚钱。
无数公司都蜂拥大数据领域,但是搞了很久,钱花了很多,都没有什么产出,原因在哪里呢?
笔者作为一个全栈工程师,在公司大数据组里从事多年的工作,反思我们的工作,觉得目前主要问题出在我们处在大数据产业的中下游,基本没有决定权,唯一的工作和其他工程师差不多,被动地写一些SQL,计算一下数据。自己都认为搞得都是沙子数据,出的成果都是沙子。很多IT公司的大数据情况也大抵如此。
当然,也有人看到了问题,去大数据上游,买数据、搞爬虫。爬虫组问过我们数据组很多次了,你们的爬取数据需求呢?是啊,我们数据组也不知道要爬什么。
这就尴尬了,整个公司没人知道哪些数据可以让我们提高利润。
唯一能做的,就是京东一样,某个客户买过什么东西,就反复地向该客户推送类似地商品,这显然让大数据技术走进了一个死胡同,让数据分析走进了一个死胡同,产出的都是沙子。
怎么办?当然是解决大数据上游的问题。
举个书上的例子。一个服装品牌,收集客户试穿衣服的例子,衣服上安装了一个磁条,换衣间安装一个磁条,统计哪些衣服被客户试穿了最多次数。想到这个办法的人,就是大数据的上游,至于后面写代码处理数据并生成报表的人,就是在大数据的下游,是这个产业链里最没价值的。
是的,公司要想通过大数据技术赚钱,就是要找到那个,想到把客户试穿衣服和最受欢迎产品联系起来的人,这才是大数据技术的核心。
2018年01月,国际油价不断上涨,国内油价跟着上涨,两桶油股价暴涨,看到没有,这三者是有逻辑链条的。看到国际油价不断上涨,就买入两桶油股票的人,永远是最有价值的,是处在数据产业链上游的。
残酷的现实是,大量大数据的从业人员,虽然他们拥有名校博士硕士的光环,他们只是处在大数据产业的中下游,永远是蒋干,事后不知道。当然,这并不妨碍他们赚钱,因为他们的薪资还是很高的。所以现在到处都是大数据、人工智能的培训机构、网络教学,和大量的学习者,他们站在了大数据产业偏中上游的位置,搞大数据的公司能不能赚钱,谁也不知道,都是他们都赚钱了。这让我想起2010年以前的ERP,当时很多企业也是对这种内部管理系统又爱又恨,但是最终没有产出,结果就是那样吧,没有革命性的效果。
或者,公司应该找麦肯锡那样的咨询公司,让专家来帮助寻找那个可以点石成金的数据。