统计违法违纪行为处分规定(什么是数据沉淀)
新闻 2022-09-20 19:08
数据沉淀又叫做资料探勘、数据采矿。它是数据库知识发现中的一个步骤。它一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
它主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组,第二阶段再由这些高频项目组中产生关联规则。关联规则挖掘通常比较适用与记录中的指标取离散值的情况。如果原始数据库中的指标值是取连续的数据,则在关联规则挖掘之前应该进行适当的数据离散化(实际上就是将某个区间的值对应于某个值),数据的离散化是数据挖掘前的重要环节,离散化的过程是否合理将直接影响关联规则的挖掘结果。
最新文章
二手机械设备交易市场(二手挖掘机去哪买比较靠谱)
1、国内挖机的二手市场基本上以上海,深圳这两地最全最大。 2、上海那边不太了解,深圳相对知道一点。 3、早年深圳的机确实很不错,原装原机而且型号齐全,可能是深圳靠近香港...[详细]