还剩4页未读,继续阅读
文本内容:
教学进度计划表教学日历202*/202*学年第三学期采用教材《数据仓库与数据挖掘Hadoop+Hive+Python》魏伟一主编,清华大学出版社参考教材《数据挖掘概念与技术》,韩家炜,机械工业出版社-2--3--4--5-名称总时数讲课实践/实验上机习题课程设计周学时计划时数7254184周次课次授课内容摘要时数目的要求备注11第1章数据仓库与数据挖掘概述
一、数据仓库概述
二、数据挖掘概述
三、数据仓库与数据挖掘的区别于联系2理解和掌握数据仓库与数据挖掘的基本概念、数据仓库的组成、应用及基于Hadoop/Spark的数据仓库技术,数据挖掘过程、数据挖掘的主要任务、数据挖掘使用的主要技术及工具2第2章认识数据数据对象与属性类型数据的基本统计描述数据可视化度量数据的相似性2理解和掌握数据对象和属性类型,数据的基本统计描述,掌握度量数据相似性和相异性的方法;了解数据可视化的方法23第3章数据预处理
一、数据预处理概述,Python数据预处理方法
二、数据清洗及Python清洗方法2了解数据预处理的目的和意义;掌握如何对数据进行清理4
三、数据集成及利用Python进行数据合并
四、数据变换与离散化
五、数据归约2掌握如何对不同数据源的数据进行合并;掌握如何对数据进行变换,使之适合建模的需要;掌握如何对数据进行消减,使得在消减后的数据集上挖掘更有效;掌握利用Python进行数据预处理的方法35实验
一、利用Python实现数据预处理(数据合并、数据清洗、数据变换)2掌握利用Python实现数据清洗、数据集成和数据变换的方法6第4章、数据仓库与联机分析处理
一、数据仓库体系,
二、多维数据模型与OLAP
三、维度建模2掌握数据仓库的体系、多维数据模型与OLAP、数据仓库的维度建模及数据仓库的发展周次课次授课内容摘要时数目的要求备注47第5章、数据仓库设计与开发
一、数据仓库设计概述
二、数据仓库设计2掌握数据仓库设计的特点,数据仓库构建模式和构建框架,数据仓库的规划、需求分析、逻辑设计、物理设计,部署和维护8
三、基于Hive的数据仓库实现2掌握基于Hive的数据仓库实现过程59实验二(选做)、基于Hadoop平台,利用Hive实现数据仓库的设计实现及基本操作掌握基于Hive的数据仓库的设计与实现10第6章回归分析
一、回归分析概述
二、一元线性回归分析2掌握回归分析原理;掌握一元线性回归分析的原理与方法611
三、多元线性回归
四、逻辑回归
五、其他回归分析2掌握多元线性回归分析;掌握逻辑回归;了解其他回归分析12实验
三、利用Python实现典型的回归分析2掌握利用Python实现典型的回归分析方法713第7章关联规则挖掘
一、关联规则分析概述
二、频繁项集挖掘方法2了解频繁项集、闭项集和关联规则的概念,理解模式评估方法,掌握Apriori算法14
三、频繁模式树算法
四、关联规则评估方法2掌握FP挖掘算法;利用Pylhon实现关联规则分析;了解其它方法的内容、了解关联规则挖掘的研究动态周次课次授课内容摘要时数目的要求备注815实验
四、Python实现数据的关联规则分析2掌握利用Python实现数据的关联规则分析16第8章分类
一、分类概述
二、决策树规约及其Python实现2了解分类及预测的基本思想、概念和意义;掌握决策树规约算法917
三、K近邻算法
四、支持向量机算法及其实现2掌握KNN算法原理与实现;了解SVM算法及其实现18
五、贝叶斯分类
六、模型评估与选择2熟悉掌握贝叶斯分类算法;理解评估分类器性能的度量方法1019
七、组合分类组合方法概述;袋装;提升和Adaboost;随机森林2掌握组合分类的原理;掌握随机森林框架及Python实现方法20实验
五、分类分析综合实验2用不同的算法实现给定数据集的分类分析,掌握利用Python实现数据分类分析的常用方法1121第9章聚类
一、聚类概述
二、K-Means算法K-Means算法实现2掌握聚类分析的基本原理熟练掌握K-Means算法的原理及其实现22
三、层次聚类方法层次聚类算法及其Python实现2掌握层次聚类算法及其实现周次课次授课内容摘要时数目的要求备注1223
四、基于密度的聚类方法DBSCAN算法原理及其实现2掌握DBSCAN算法及其实现24
五、其他聚类方法STING算法、COBWENB算法及模糊聚类算法2了解STING算法、COBWENB算法掌握模糊聚类算法1325
六、聚类评估估计聚类趋势确定簇数目的方法测定聚类质量2掌握聚类评估的基本方法;确定簇数目的常用方法;聚类质量的测定26实验六数据的聚类分析综合实验2掌握数据聚类的典型算法1427第10章神经网络与深度学习
一、神经网络基础神经元模型,感知机与多层网络2理解神经网络基本原理;掌握感知机的原理28
二、BP神经网络
三、深度学习基础2理解多层前馈神经网络的原理;理解后向传播算法;了解BP神经网络的应用;了解深度学习的思想及主要模型1529实验
七、BP神经网络案例实验2掌握BP神经网络的Python实现周次课次授课内容摘要时数目的要求备注30第11章离群点检测
一、离群点概述
二、离群点检测方法
三、skiearn中的异常值检测方法2掌握离群点的概念与常用检测方法,掌握sklearn中的异常值检测方法1631第12章文本和时序数据挖掘
一、文本数据挖掘
二、文本分析与挖掘主要方法2掌握文本数据挖掘的过程与任务、文本分析与挖掘的主要方法32
三、时序数据挖掘2时序数据挖掘的过程与典型方法1733第13章数据挖掘案例选讲2数据挖掘案例分析与实现34实验
八、文本分析与时序数据分析挖掘2对文本数据或时序数据进行分析与挖掘1835第十一章数据挖掘案例分析实验
九、数据挖掘综合案例实现2数据挖掘综合案例分析与设计36实验
九、数据挖掘综合案例实现2数据挖掘综合案例分析与实现。