数据挖掘复习课
第1章 认识数据挖掘
1、数据挖掘的定义
2、有指导学习和无指导学习
3、数据挖掘的过程
第2章 基本数据挖掘技术
1、决策树概念和C 4.5算法的一般过程
2、决策树关键技术:最大增益率
3、决策树规则:决策树,产生式规则,正确率和覆盖率
4、Apriori算法的基本思想
5、关联规则及其置信度和支持度
6、K-means算法的基本思想
7、K-means聚类分析实例
第3章 数据库中的知识发现
1、KDD的定义(了解)
2、数据预处理:直方图归约、数据规范化和数据平滑
第5章 评估技术
1、评估分类类型输出模型:混淆矩阵和分类正确率、查准率和查全率
2、评估数值型输出模型:平均绝对误差,均方误差,均方根误差
第6章 神经网络
1、人工神经元模型(会画会计算)
2、BP神经网络结构(会画,比如一个输入一个输出两个包含三个神经元隐层),前向计算过程
3、BP算法的一般过程
4、卷积神经网络的基本操作——卷积和池化,卷积特征(局部感受野、权值共享)
第7章 统计技术
1、一元线性回归、多元线性回归——最小二乘法
2、贝叶斯分析:贝叶斯分类器
3、凝聚聚类算法的一般步骤、例题
4、Cobweb分层聚类算法:CU值的计算