数据挖掘的技术有很多种,按照不同的分类有不同的分类法。
下面着重讨论一下互联网数据挖掘中常用的一些技术:统计技术,关联规则,连接分析,决策树,神经网络,差别分析,概念描述七种常用的互联网数据挖掘的技术。
数据挖掘涉及的科学领域和技术很多,如统计技术。统计技术对数据集进行挖掘的主要思想是:统计的方法对给定的数据集合假设了一个分布或者概率模型(例如一个正态分布)然后根据模型采用相应的方法来进行挖掘。
决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。
差别分析的目的是试图发现数据中的异常情况,如噪音数据等异常数据,从而获得有用信息。
评论