大数据时代,如何做数据挖掘与分析

2019-04-09 11:47 来源:网络
浏览量: 收藏:0 分享

  企业当中无效、利用率最低的数据是什么数据?

  很多质量的检测项目都是测量“产量”、“合格/不合格”、“通过/不通过”或“符合/不符合”这些弱指标的,这类数据属于计数型数据,具体而言,都属于不良数据,这类数据的计量结果通常都计为1或0。

  不良数据的价值是帮助使用者描述感觉:好或者不好,而不关心数据所指的具体对象。如果产量不好,就需要提供更有力的变量型数据来隔离或者解决其中的问题。计量型数据可以用连续、随机的数值来统计,例如长度、高度、直径、压力、百分比、温度等等。

  企业针对工业数据常常犯的一个最大的错误就是:将大量计量型数据简单粗暴地转化为“通过/不通过”这类计数型数据。从另外一个角度来看,统计结果的可靠性更多的依赖人为判断,并没有具体的现场数据作为强有力的证据支撑。

  在数据采集变得越来越容易的当今,仅仅收集数据,只是成功的第一步而已。要想将制造数据的价值真正挖掘出来,做到最大化的有用且高效,可从以下三个方面来计划:

  第一步,明确数据采集的源头。需要对内部现有的仪器设备做一个全面的排查,明确哪些数据是手工采集、哪些数据能够借助接口自动采集,并做进一步的规划,明确数据采集的时间频率、采集的关键信息点、控制图分析类型、控制指标、异常处理等信息。

  第二步,明确数据的可用性。有的数据用来做实时的现场判断,有的用来做长期的战略决策,而有的,其实只是占用空间而已,没有实际价值。实时采集到的数据需要通过专业的分析和报警工具,提醒用户确定是否需要对生产做出调整,同时,确保生产制程的稳定性。 用于制订长期战略决策的数据,必须从长期的维度来挖掘、分析数据,找到最关键的数字趋势,突出值得关注的信息。而大量无关紧要的数据,最好及时处理、释放内存空间。

  最后一步,数据价值的衡量指标。对于收集的数据,有哪些衡量指标?这些指标对自上而下和自下而上的决策是否产生影响?它们能否对正确的行为给予回报和奖励?

标签:

责任编辑:bozhihua
在线客服