大数据时代跟着BAT后面跑不理智,运营商要闯出自己的一条路

2016-07-21 08:07 来源:数据猿
浏览量: 收藏:0 分享

大数据,运营商,数据变现

  最近浙江移动做了个反通讯信息欺诈模型,部分场景的准确率已经做到了95%以上,覆盖率75%以上,不少人来问,怎么做到的?

  跟着BAT等公司屁股后面跑显然是不理智的,运营商等传统企业在诸多方面有很多差距,但每个企业都有自己的数据特色,每个企业的建模师也拥有垂直领域的专业知识,这个是企业拥有的差异化优势,套用一句老话,需要走有自己特色的数据掘金之路。

  现在运营商不能说差钱,很多底层技术也能买来或拿来,笔者觉得更多是在建模创新思维上的差距,固然我们需要学习互联网,但不能人云亦云,否则,没前途,也没钱途,被人家做烂的东西,再去捡,没啥空间。

  运营商要闯出一条自己的路,在数据创新上突破是一条可行之路,因为人家做不到,起码在现阶段,基本还没有竞争对手,笔者提四个方面,也是最近的一些思考,知道的人自然知道,不知道的人也可以琢磨下,为什么笔者这么提:

时间序列

  运营商习惯做状态分析,所有的指标都是用日的状态或月的状态来统计指标值,它习惯将时间作为一个常量来对待,建模中基本不用作特征变量,无论是基础模型,还是融合模型,YYYYMMDD及YYYYMM的表都是建模的标配,实际上,它在简化模型的同时,也丢掉了大量的价值信息。这种以传统KPI指标为核心的建模方式,早就应该扔到历史的垃圾桶去了。

  为什么会这样,原因很多,笔者列出几个,一是传统业务需求简单,状态统计即可,没人关注时序,二是数据处理能力不够,运营商以前搞搞决策树、逻辑回归还可以,真要搞点针对海量时序清单数据的算法,的确勉为其难,三是主动意识,运营商的建模师很少,事务性工作的确偏多,没有人有精力专门研究这个。

  大数据时代,运营商首先要学会理解时间这个字段的价值,理解的越透,详单数据的价值就几何层级的上去了,光是语音通信数据,能够创造的模型好过大多数互联网社交数据。

事件模型

  在数据建模上缺乏长远规划,回想起来的确太可惜了,贻误了很多时机。比如运营商做高中毕业生模型,优势有多大大家都清楚,考试位置+分数查询,做不准也难,反问一下,为什么以前不做,如果5年前做,那这一代大学生的营销挖潜再也不是难事,而且一搞就是可以持续4年,有些人一直可以做到博士毕业,甚至留校。

  再比如,我们一直通过线上数据找用户偏好,比如XX明星粉丝,挖了老半天,也觉得效果一般,但某明星在杭州办个演唱会,也没人会关注下这是搜集数据的一个好契机,又如各种重大节日,都是抓用户特征建模的好时机,我们都错过了,由此可见一般。

  现在大家都在提事件营销,那也只是一次营销机会,但如果知道如何打造事件模型,那是一劳永逸的事情,但这类数据是需要运营的,珍贵的数据并不仅仅是看得到的那一部分,有很大一部分数据在冰山下,是需要我们建模拿到的,金矿也不是躺着就能赚钱的,关键是,要有人能看到这个机会,以前笔者提建模一定要自己搞,也是这个原因,因为这个是持续性的事情,没人能比自己做得更好。

时间、空间和用户三维模型

  笔者以前说过,运营商建模的想象空间是远超BAT的,有人真正做过运营商位置时序数据的无监督的聚类模型吗,笔者一直也很好奇,如果针对运营商每天千亿的信令(结合用户)做个聚类,会得到怎样的一个震撼结果,我们可以想象,如果可以,是不是可以真的颠覆传统的产品导向的建模方式,真正的从用户出发去寻找潜在的场景呢?

  运营商的B域,O域数据只要结合,就是三个维度的数据矩阵,给予每个人无限的遐想,在技术层面,当然我们会面临挑战,但有挑战就有机遇,这个机遇只有运营商的建模师、架构师能够享用到,也是很幸福的事情。

  从反伪基站,反刷单,反支付欺诈诸如此类,从传统的产品营销到真正的用户营销,时空模型的确可以给予革命的机会。

互联网那些模型

  互联网的很多模型,包括搜索引擎(含爬虫,索引,排序等等)、自然语言处理、语音识别、深度学习、逻辑回归等,运营商要拿来主义,开始不用自己搞算法,能用就可以了,百度等基于搜索引擎创造了售卖关键字查网页赚广告费的模式,运营商COPY这个引擎,做一些转化,完全可以做售卖关键字用户模型,只不过,查询的网页变成了用户,即使对于内部营销,那也是巨大价值的事情,运营商没必要跟着互联网公司学广告标签的方式,可以自成一派。

  又如语音识别,对于运营商客服投诉的自动记录、自动分类及分析有很大的帮助,客服的机器换人肯定也是未来的趋势,这些互联网公司拥有的模型,只要有一个用好,就可以产生巨大的价值。

  再如深度学习,我已经知道一些广告合作伙伴在用它来提升推荐能力了,但我们由于能力欠缺,还摸不着门道,也没人来研究和实践,的确是再次落后了。

  大数据时代,无所谓传统企业和互联网企业,大家是平的,没人会因为你底子薄就给你多点时间,运营商也不再是在通信领域里自己过家家,我们面临残酷的市场竞争,要搞数字化业务,就必须跟上技术创新的步伐。

结语

  提了四点,想表达的是,运营商需要能真正重视建模工作,从数据建模中找到创新的契机,要说商业模式,大家互相COPY是很容易的,同质化也是很容易的,数据贬值也是很容易的,客户看重的,实际是数据中蕴藏的价值,而这些价值,大家现在能看到的估计也基本看到了,剩下的冰山下的那大部分,需要运营商自己去挖掘并告诉客户,不能总是说客户你自己想吧,需求是需要创造出来的,这才是未来真正的竞争力,也是差异化所在,实际上,大多数传统企业自己都搞不清楚到底大数据对它有多少价值,运营商现在需要扎实的做好模型团队的建设工作,将这个能力牢牢掌握在自己手里,现在搞运营变现是积累经验,对外变现赚钱倒真不是最为关键的,自己能力起来了,内部精益运营提升一个点,那也是不得了的事情。

  回过头来再谈反通讯信息欺诈模型,实际上它采用了一个跟Alphgo类似的原理,即双网络来提升识别准确率,两者是有异曲同工之妙的,但算法远没有Alphgo那么复杂,思路好实用就行了,不是吗?但即使是这个,你用传统的方式做,准确率也是死活上不去的。

  最后,数据建模这个能力无法一蹴而就,运营商在谈数据变现和数据优势的时候,需要冷静的思考下,持续的挖矿能力有没有,没有,就需要虚心的学习和实践,要有一定的耐心,现在还不晚,但如果还不起步,就只能把数据卖成白菜价了,那是杀鸡取卵的做法,对于整个行业都非常不利,那种将大数据打个包作为通信产品附属品售卖的方式,更是可笑至极。

标签:

责任编辑:admin
在线客服