还剩29页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
《数据仓库与数据挖掘》课程教案首页学院计算机系/学院《教据仓库与救据挖掘fHadoop+Hive+Python)》课程数案第14次课2学时综合实验
(三)掌握回归分析的主要方法及其实现要求学生应该熟练掌握如下知识的运用1)掌握各种常用的回归分析方法2)不同回归分析方法的实现及其特点比较《数据仓库与救据挖掘fHadoop+Hive+Python)》课程教案第15次课2学时《教据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第16次课2学时《数据仓库与数据挖掘fHadoop+Hive+Python)》课程数案第17次课2学时综合实验
(四)介绍关联规则挖掘实现方法2)熟悉关联规则分析的实现《教据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第18次课2学时《数据仓库与数据挖掘Hadoop+Hive+Python》课程教案第19次课2学时《救据仓库与数据挖掘CHadoop+Hive+PythonJ》课程教案第20次课2学时任务布置《数据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第21次课2学时《数据仓库与救据挖掘fHadoop+Hive+Python)》课程教案第22次课2学时《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出《数据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第23次课2学时任务布置《数据仓库与数据挖掘》课程教案第1次课2学时《数据仓库与救据挖掘fHadoop+Hive+Python)》课程教案第24次课2学时讲授内容
一、层次聚类1)层次算法原理2)簇间相似性度量3)分裂层次聚类4)凝聚层次聚类5)算法应用《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出《数据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第25次课2学时《教据仓库与数据挖掘fHadoop+Hive+Python》课程教案第26次课2学时《数据仓库与救据挖掘fHadoop+Hive+Python)》课程教案第27次课2学时《数据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第28次课2学时《数据仓库与救据挖掘fHadoop+Hive+Python)》课程教案第29次课2学时讲授内容1)神经元模型2)感知机与多层感知机课后学习阅读神经网络文献任务布置主要《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出参考资料《教据仓库与救据挖掘fHadoop+Hive+Python)》课程数案第30次课2学时任务布置《数据仓库与救据挖施fHadoop+Hive+Python》课程数崇第31次课2学时任务布置《数据仓库与救据挖施fHadoop+Hive+Python)》课程数崇第32次课2学时任务布置《数据仓库与救据挖施fHadoop+Hive+Python)》课程数崇第33次课2学时《数据仓库与救据挖施fHadoop+Hive+Python)》课程数崇第2次课2学时《数据仓库与救据挖施fHadoop+Hive+Python)》课程数崇第34〜36次课6学时《教据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第3次课2学时《教据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第4次课2学时《教据仓库与救据挖掘fHadoop+Hive+Python)》课程数案第5次课2学时《救据仓库与数据挖掘CHadoop+Hive+PythonJ》课程教案第6次课2学时《教据仓库与数据挖掘fHadoop+Hive+Python)》课程教案第7次课2学时《数据仓库与救据挖掘fHadoop+Hive+PythonJ》课程教案第13次课2学时1)多元线性回归2)逻辑回归讲授内容
一、多元线性回归1)多元线性回归分析模型2)多元线性回归参数估计与假设检验3)多元线性回归的Python实现
二、逻辑回归
三、其他回归分析1)多项式回归2)岭回归3)逐步回归等《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出参考资料版社课程/项目名称数据仓库与数据挖掘课程总学时72学时理论54学时实验18学时学分3课程课程类别专业必修■专业必修口公共必修口公共选修授课教师***授课专业数据科学与大数据技术授课班级教学目的和要求本课程的主要目的是培养学生的数据仓库与数据挖掘理论分析与应用实践的综合能力通过本课程的教学,使学生掌握数据仓库与数据挖掘的一般原理和处理方法,能使用机器学习理论解决数据挖掘相关的问题教学重点、难点教学重点认识数据数据预处理数据仓库与联机分析处理数据仓库设计与开发回归分析关联规则挖掘分类与预测聚类分析神经网络与机器学习基础离群点检测以及Python数据挖掘案例分析等教学难点掌握数据仓库的体系、维度建模和数据仓库设计等;掌握数据挖掘基本过程、处理步骤和方法;掌握回归分析、分类、聚类等机器学习算法;熟练关联规则挖掘方法;掌握数据分析与数据挖掘的基本方法教学资源多媒体课件习题答案微课视频其他教学资源《数据仓库与数据挖掘Hadoop+Hive+Python》魏伟一等主编,清华大学出版社教学环境多媒体教学,课堂教学与学生上机实践相结合案例实现授课内容关联规则挖掘1教学目的与要求介绍关联规则挖掘方法要求学生应该熟练掌握如下知识的运用1)了解频繁项集、闭项集和关联规则的概念,理解模式评估方法2)掌握Aoriori算法重点难点1Aoriori算法教学进程安排授课内容
一、关联规则分析概述1)频繁项集、闭项集和关联规则
二、Apriori算法1)频繁项集挖掘方法2)由频繁项集产生关联规则3)提高Apriori算法的效率课后学习任务布置实现Aoriori算法主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容关联规则挖掘2教学目的与要求关联规则挖掘挖掘方法通过本课的学习,学生应该掌握如下知识1)熟悉掌握FP频繁模式增长树算法2)熟悉掌握关联规则的评估方法重点难点1)FP频繁模式增长树算法2)关联规则的评估方法教学进程安排讲授内容
一、频繁模式增长树算法
二、使用垂直数据格式挖掘频繁项集
三、关联模式评估方法1)强关联规则不一定是有趣的2)从关联分析到相关分析
四、关联规则应用课后学习任务布置熟悉FP树算法原理主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容分类分析1教学目的与要求数据分类分析1通过本课的学习,学生应该掌握如下知识1)掌握分类与预测的基本思想2)分类的概念和意义3)决策树规约方法重点难点1)分类的原理2)决策树规约算法教学进程安排讲授内容
一、分类概述
二、决策树规约1)决策树原理ID3算法C
4.5算法CART算法5)树剪枝课后学习任务布置熟悉Seaborn数据可视化方法主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容分类分析2教学目的与要求分类算法介绍2O要求学生应该熟练掌握如下知识的运用K近邻算法SVM算法重点难点1KNN算法2SVM算法教学进程安排授课内容
一、K.近邻算法1算法简介2算法的Python实现
二、SVM算法1算法原理2算法实现课后学习任务布置KNN和SVM算法实现主要参考资料《数据仓库与数据挖掘Hadoop+Hive+Python》魏伟一等主编,清华大学出版社授课内容分类分析3教学目的与要求数据分析算法介绍3o通过本课的学习,学生应该掌握如下知识1)掌握贝叶斯分类算法2)掌握模型评估与选择重点难点1)贝叶斯分类方法2)模型评估与选择教学进程安排讲授内容
一、贝叶斯分类1)算法原理2)朴素贝叶斯分类3)高斯朴素贝叶斯分类4)多项式朴素贝叶斯分类
二、模型评估与选择1)分类器性能评估2)模型选择课后学习贝叶斯分类算法实现与评估主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容分类分析4教学目的与要求介绍分类算法4o要求学生应该熟练掌握如下知识的运用1)组合分类框架与原理2)组合分类方法重点难点1Adaboost2随机森林教学进程安排授课内容
一、组合分类1)组合分类方法简介2)袋装3)提升和Adaboost4)随机森林授课内容综合实验
(五)教学目的与要求分类算法综合应用通过本课的学习,学生应该掌握如下知识1)熟悉典型的分类算法应用2)熟悉分类算法的评估与模型选择重点难点1)典型分类算法2)分类算法评估与模型选择教学进程安排实验内容
一、分类分析综合实验1)用不同的算法实现给定数据集的分类分析2)掌握利用Python实现数据分类分析的常用方法授课内容聚类分析1教学目的与要求聚类算法介绍要求学生应该熟练掌握如下知识的运用1)掌握聚类分析的基本原理2)掌握K-Means算法的原理重点难点1)聚类算法的原理2)K・Means算法的原理教学进程安排授课内容
一、聚类分析概述1)聚类分析概念2)聚类算法分类
二、K-Means算法1)算法基本原理2)算法改进3)算法实现课后学习K・Means算法代码实现(不调用系统方法)主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容数据仓库与数据挖掘概论教学目的与要求通过本课的学习,学生应该掌握如下知识1)数据仓库的定义与特点2)数据仓库与操作型数据库的关系3)数据仓库的组成、应用4)基于Hadoop和Hive的数据仓库技术5)数据挖掘的概念与基本内容6)数据挖掘的主要任务7)数据挖掘的主要数据源8)数据挖掘与数据仓库的区别于联系重点难点1)数据仓库与操作型数据库的关系、数据仓库组成2)数据挖掘的概念、主要任务及数据挖掘主要使用的技术教学进程安排教学导入介绍数据仓库与数据挖掘的重要性,举例说明数据仓库和数据挖掘典型案例,逐步引入到课程的介绍内容中来授课内容
一、《数据仓库与数据挖掘(Hadoop+Hive+Python)》课程介绍介绍本门课程的学科地位、考核方式、学习内容安排、可以参考的学习资料
二、讲授数据仓库与数据挖掘的定义、原理与发展1)数据仓库的定义,与操作型数据库的关系2)数据仓库的组成与应用3)讲授数据分析的含义和内容4)讲授数据挖掘与数据分析的联系与区别5)讲授数据挖掘的主要任务6)讲授数据挖掘主要的数据源课后学习任务布置查阅数据挖掘用途的相关资料与案例主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容聚类分析2教学目的与要求聚类算法介绍通过本课的学习,学生应该掌握如下知识1)掌握层次聚类算法原理2)掌握层次聚类算法重点难点1)层次聚类算法原理2)层次聚类算法授课内容聚类3教学目的与要求聚类算法介绍要求学生应该熟练掌握如下知识的运用1)掌握基于密度的聚类算法思想2)掌握DBSCAN算法重点难点1)基于密度的聚类算法思想2)掌握DBSCAN算法教学进程安排授课内容
一、基于密度的聚类1)算法原理2)算法改进3)DBSCAN算法实现课后学习任务布置算法示例实现主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容聚类4教学目的与要求聚类算法介绍要求学生应该熟练掌握如下知识的运用1了解其他典型的聚类算法2掌握FCM算法重点难点STING聚类FCM聚类教学进程安排授课内容
一、其他聚类方法1STING聚类2概念聚类3模糊聚类课后学习任务布置FCM算法实现主要参考资料《数据仓库与数据挖掘Hadoop+Hive+Python》魏伟一等主编,清华大学出版社授课内容聚类5教学目的与要求聚类分析介绍通过本课的学习,学生应该掌握如下知识1)了解估计聚类趋势方法2)掌握确定簇数目的方法3)熟悉聚类质量测定方法重点难点1)确定簇数目的方法2)聚类质量测定方法教学进程安排讲授内容
一、聚类评估1)聚类趋势估计2)聚类簇数目确定3)聚类质量测定课后学习任务布置查阅聚类评估的主要方法主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容综合实验
(六)教学目的与要求应用聚类算法及其评估方法,实现数据聚类的综合分析要求学生应该熟练掌握如下知识的运用1)熟悉典型的聚类算法2)掌握典型聚类算法的特性重点难点1)聚类算法实现2)算法评价教学进程安排实验内容
一、数据的聚类分析综合实验1)算法实现2)算法分析与评估3)算法对比授课内容神经网络与深度学习1教学目的与要求介绍神经网络基本原理通过本课的学习,学生应该掌握如下知识1)熟悉神经元模型2)感知机与多层感知机重点难点1)神经元模型3)感知机原理授课内容神经网络与深度学习2教学目的与要求神经网络与深度学习基础介绍通过本课的学习,学生应该掌握如下知识1)熟悉多层前馈神经网络的原理2)理解后向传播算法重点难点1)多层前馈神经网络的原理2)理解后向传播算法教学进程安排讲授内容1)多层前馈神经网络BP学习算法BP神经网络应用课后学习BP神经网络应用案例学习主要参考资料《数据仓库与数据挖掘(Haduop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容神经网络与深度学习3教学目的与要求深度学习基础介绍通过本课的学习,学生应该掌握如下知识了解深度学习基本原理了解几种常见深度学习模型重点难点1深度学习原理2CNN模型教学进程安排讲授内容1深度学习概述2常用的深度学习模型课后学习查阅CNN深度学习文献主要参考资料《数据仓库与数据挖掘Hadoop+Hive+Python》魏伟一等主编,清华大学出版社授课内容综合实验
(七)教学目的与要求BP神经网络综合应用通过本课的学习,学生应该掌握如下知识1)掌握BP神经网络的应用重点难点1)多层前馈神经网络的原理2)理解后向传播算法教学进程安排实验内容BP神经网络综合应用课后学习BP神经网络应用案例学习主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容神经网络与深度学习2教学目的与要求离群点检测介绍通过本课的学习,学生应该掌握如下知识1)掌握离群点的概念分类2)掌握离群点检测的常用方法重点难点1)离群点检测的常用方法教学进程安排讲授内容
一、离群点概述1)离群点概念2)离群点类型
二、离群点检测1)基于统计学的检测2)基于邻近的检测3)基于聚类的检测4)基于分类的检测课后学习任务布置掌握离群点检测方法,利用sklearn进行离群点检测主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容认识数据教学目的与要求认识数据要求学生应该熟练掌握如下知识的运用1)掌握数据的属性及属性类型2)掌握数据的基本统计描述3)掌握数据可视化方法4)掌握数据对象的相似性度量方法重点难点1)数据对象的属性及其分类2)数据的基本统计描述和数据对象的相似性度量教学进程安排授课内容认识数据
一、属性及其类型1)属性2)数据属性类型
二、数据的基本统计描述1)中心趋势度量2)数据散布度量
三、数据可视化方法
四、数据对象的相似性度量1)不同类型属性的相似性度量方法2)距离度量的Python实现课后学习任务布置示例练习,数据对象相似性度量代码实现主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容数据挖掘案例分析1-3教学目的与要求掌握数据挖掘综合应用重点难点数据挖掘与机器学习综合应用教学进程安排实验内容1)数据挖掘应用2)机器学习典型算法应用课后学习任务布置数据挖掘与机器学习综合案例实现主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容数据预处理1教学目的与要求介绍数据预处理的必要性,数据预处理的主要方法要求学生应该熟练掌握如下知识的运用1)数据预处理方法概述2)掌握数据清洗的方法3)掌握利用python进行数据清洗的方法重点难点1)数据清洗内容2)利用Python进行数据清洗教学进程安排授课内容
一、数据预处理的必要性1)数据中一般存在的问题2)数据质量要求
二、数据清洗1)数据清洗的内容及其方法2)利用Pandas进行数据清洗课后学习任务布置Pandas数据结构及其操作、熟悉教材习题主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容数据预处理2教学目的与要求数据预处理2通过本课的学习,学生应该掌握如下知识1)数据集成中的关键问题2)熟悉掌握数据标准化方法3)数据归约重点难点1)数据集成过程中的关键问题2)数据变换和收据归约方法教学进程安排讲授内容
一、数据集成1)掌握集成中的主要问题2)利用Pandas进行数据合并
二、数据标准化
三、数据归约1)维归约2)数量归约和压缩
四、数据变换与离散化1)数据变换策略2)利用sklearn进行数据预处理课后学习任务布置熟悉Pandas统计分析方法主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容实验
(一)教学目的与要求利用Python实现数据预处理综合实验1)掌握数据预处理方法2)利用Python实现数据预处理重点难点1)数据预处理及其实现教学进程安排授课内容
一、数据预处理内容
二、利用Python实现数据预处理课后学习任务布置熟练掌握利用Python进行数据预处理的方法,案例实现主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容第4章数据仓库与联机分析处理教学目的与要求利用Python实现数据预处理综合实验1)掌握数据预处理方法2)利用Python实现数据预处理重点难点1)数据预处理及其实现教学进程安排授课内容
一、数据预处理内容
二、利用Python实现数据预处理课后学习任务布置熟练掌握利用Python进行数据预处理的方法,案例实现主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容回归分析1教学目的与要求介绍数据回归分析基础要求学生应该熟练掌握如下知识的运用1)掌握数据回归分析的原理2)数据回归分析的分类3)掌握一元线性回归分析过程重点难点1)回归分析原理2)一元线性回归分析教学进程安排授课内容
一、回归分析概述1)回归分析的定义与分类2)回归分析过程
二、一元线性回归分析一元线性回归分析方法一元线性回归分析模型的参数估计3)误差方差估计与主要统计检验4)儿线性回归的Python实现课后学习任务布置熟悉一元线性回归分析的原理与实现主要参考资料《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社授课内容回归分析2数据回归分析2通过本课的学习,学生应该掌握如下知识教学目的与要求1)多元线性回归2)逻辑回归3)其他回归分析。