不久前,IBM使用大数据信息技术成功开发了“经济指标预测系统”。借助该预测系统,可通过统计分析新闻中出现的单词等信息来预测股价等走势。
IBM的“经济指标预测系统”首先从互联网上的新闻中搜索与“新订单”等与经济指标有关的单词,然后结合其他相关经济数据的历史数据分析与股价的关系,从而得出预测结果。
在“经济指标预测系统”的开发过程中,IBM还进行了一系列的验证工作。IBM以美国“ISM制造业采购经理人指数”为对象进行了验证试验,该指数以制造业中的大约20个行业、300多家公司的采购负责人为对象,调查新订单和雇员等情况之后计算得出。实验前,首先假设“受访者受到了新闻报道的影响”,然后分别计算出约30万条财经类新闻中出现的“新订单”、“生产”以及“雇员”等5个关键词的数量。追踪这些关键词在这段时期内的搜索数据变化情况,并将数据和道指的走势进行对比,从而预测该指数的未来动态。
IBM研究称,一般而言,当“股票”、“营收”等金融词汇的搜索量下降时,道指随后将上涨,而当这些金融词汇的搜索量上升时,道指在随后的几周内将下跌。
据悉,IBM的试验仅用了6小时,就计算出了分析师需要花费数日才能得出的预测值,而且预测精度几乎一样。
案例解析:从本案例可以看出,大数据不再仅仅局限在媒体与厂商之间的讨论,它犹如一场数据旋风开始席卷全球,从各行各业的IT主管到政府部门都开始重视大数据及其价值。
目前,不少信息系统企业都在使用大数据信息技术开发预测系统。例如,2011年,英国对冲基金Derwent Capital Markets建立了规模为4000万美金的对冲基金,该基金是首家基于社交网络的对冲基金,该基金通过从Twitter的数据内容来感知市场情绪,从而进行投资。无独有偶,美国加州大学河滨分校也公布了一项通过对Twitter消息进行分析从而预测股票涨跌的研究报告。
企业数据就是新时代还未开采的石油,具有非常之高的价值。国外一些金融机构已经开始做一些前瞻性的研究了,这种做法是非常值得国内金融机构学习和借鉴的。例如,国内大部分证券公司仍然没有摆脱交易性数据为主的特点,但很多有前瞻意识的证券公司已经开始做一些转型了,对微博、互联网等外部数据进行一些分析与预测。