还剩5页未读,继续阅读
文本内容:
河北经贸大学课程水平认定《数据挖掘》学习大纲课程名称数据挖掘课程类型必修课总学时学时学分学分322合用专业统计学开课单位数统学院
一、学习性质《数据挖掘》是大数据背景下现代统计数据分析不可缺少的重要工具通过本课程的学习,培养学生的数据分析技能,熟悉和掌握大数据信息提取与结果分析,培养适应社会数据分析岗位需求的专业人材
二、学习目的本课程目的主要是让学生在学习期间掌握数据挖掘理论以及如何用数据挖掘来解决实际问题,了解某个数据挖掘解决方案对特定问题是否切实可行,学习知识发现的过程,利用基本的统计和非统计技术评估数据挖掘对话的结果等
三、学习要求重点掌握几种数据挖掘策略及每种策略的合用时机;如何通过几种数据挖掘技术建立模型来解决问题
四、课程内容与学时分配课程内容与学时分配学时分配课程内容自学自学研讨调研第一章引言22第二章数据预处理22第三章分类和预测48第四章复杂类型数据的挖掘44第五章数据挖掘的应用和发展趋势22
五、课程考核和成绩评定课程考核为闭卷考试成绩评定考试成绩实行百分制,其中基础知识测试题的分值掌握在分摆布;综合能力测试题的分40值掌握在分摆布分为及格6060
六、推荐教材和学习参考书推荐教程作者出版社及出版时间日JIAW HAN数据挖掘概念与技术机械工业出版社,2022MICHELINE KAMBER学习参考书作者出版社及出版时间数据挖掘导论范明,范红建人民邮电出版社,2022数据挖掘与应用张俊妮北京大学出版社,2022数据挖掘-概念、模型、闪四清,陈茵,程雁清华大学出版社,2003方法和算法
七、学习具体内容第一章引言
一、基本要求要求学生重点了解当今世界上流行数据挖掘技术的应用范围和流程,对数据挖掘有一个总体的认识;重点掌握基本功能和操作;海量数据的选择,会正确解释软件处理的结果,特别掌握样本信息Clementine的解释
二、授课方法自学
三、学习内容
(一)什么激发了数据挖掘以及它的重要性
(二)数据挖掘定义
(三)在何种数据上进行数据挖掘、关系数据库
1、数据仓库
2、事务数据库
3、高级数据库系统和高级数据库应用4
(四)数据挖掘功能一一可以挖掘什么类型的模式、关联分析
1、分类和预测
2、聚类分析
3、孤立点分析
4、演变分析5
(五)数据挖掘软件的基本功能和操作Clementine
四、重点难点数据挖掘的概念和基本功能
五、思量与讨论、什么是数据挖掘?
1、数据挖掘的对象是什么?
2、数据挖掘的主要功能有哪些?
3、的基本功能和操作4Clementine第二章数据预处理
一、基本要求要求学生重点掌握数据预处理的用途,能正确解释软件处理的结果,特别是样本信息的解释;同时要求学生阅读一定数量的文献资料,加深理解如何对数据集进行合理的数据预处理
二、授课方法自学
三、学习内容
(一)数据预处理的原因
(二)数据集成和变换、数据集成
1、数据变换2
(三)缺失值处理的方法、处理带有缺失值的记录
1、处理带有缺失值的字段
2、归因或者填充缺失值
3、用于缺失值的函数4CLEM
四、重点难点数据集中缺失值的处理方法及软件实现Clementine
五、思量与讨论、为什么进行数据预处理?
1、数据预处理的主要方法和合用范围是什么?2第三章分类和预测
一、基本要求要求学生理解分类、预测的各种建模方法的基本思想,掌握分类、预测建模方法的软件实现,了解分类、预测方法的基本应用
二、授课方法自学
三、学习内容
(一)什么是分类,什么是预测
(二)分类预测决策树、决策树的基本思想
1、算法及软件实现2C
5.
0、决策树的案例及分析3
(三)分类预测神经网络、神经网络的基本思想
1、神经网络的软件实现
2、神经网络的案例及分析3
(四)预测、线性回归和多元回归
1、非线性回归
2、其他回归模型3
(五)分类预测的准确性、评估分类法的准确率
1、提高分类法的准确率
2、准确率足够判定分类法吗3
四、重点难点分类、预测的各种建模方法、软件实现及应用
五、思量与讨论、分类预测的作用和基本思想是什么?
1、决策树的基本思想和软件实现
2、神经网络的基本思想和软件实现
3、分类预测模型的评估4第四章复杂类型数据的挖掘
一、基本要求要求学生对复杂类型数据的挖掘方法有一个概括的认识,理解并掌握时间序列数据挖掘模型的构建方法及应用
二、授课方法自学
三、学习内容
(一)复杂数据对象的多维分析和描述性挖掘、结构化数据的概化
1、空间和多媒体数据概化中的会萃和近似计算
2、对象标识符和类
3、类复合层次的概化
4、对象立方体的构造与挖掘
5、用分而治之方法对规则数据库进行基于概化的挖掘6
(二)空间数据库挖掘、空间数据立方体构造和空间1OLAP、空间关联分析
2、空间聚类方法
3、空间分类和空间趋势分析
4、光栅数据库挖掘5
(三)时序数据和序列数据的挖掘、趋势分析
1、时序分析中的相似搜索
2、序列模式挖掘
3、周期分析4
四、重点难点时间序列数据挖掘模型的构建方法及应用
五、思量与讨论、什么是复杂类型数据?
1、复杂类型数据的数据挖掘模型主要有哪些?
2、时间序列数据挖掘模型的构建方法及软件实现3第五章数据挖掘的应用和发展趋势
一、基本要求要求学生了解数据挖掘的应用和发展趋势
二、授课方法自学
三、学习内容
(一)数据挖掘的应用、针对生物医学和数据分析的数据挖掘1DNA、针对金融数据分析的数据挖掘
2、零售业中的数据挖掘
3、电信业中的数据挖掘4
(二)数据挖掘的发展趋势
四、重点难点数据挖掘的应用范围和发展趋势
五、思量与讨论、数据挖掘的主要应用领域
1、数据挖掘的发展趋势2。