文本内容:
教学日历(学年第学期)20xx〜20xx x开课学院开课专业讲授学时32课程名称样本数据处理授课教师实践/实验学时32授课年级授课班级总学时64使用教材《样本数据处理》参考书目《样本数据处理》校历周次授课内容分章节题目第一章数据预处理概述(4学时)
1.1数据预处理的背景与目的(1学时)第1周
1.2数据预处理的流程(2学时)
1.3数据预处理的工具(1学时)第二章Kettle工具的初步使用(4学时)
2.1Kettle的安装(2学时)第2周
2.2Kettle的使用(2学时)第三章数据的导入与导出(4学时)
3.1基于文件的数据导入与导出(2学时)第3周
3.2基于数据库的数据导入与导出(2学时)第三章数据的导入与导出(4学时)
3.3基于Web的数据导入与导出(2学时)第4周
3.4基于CDC变更数据的导入与导出(2学时)第四章数据清洗(4学时)第5周
4.1数据清洗概述(2学时)
4.2数据排重(2学时)第四章数据清洗(2学时)
4.3使用脚本组件进行数据清洗(2学时)第6周第五章数据标注(2学时)
5.1数据标注简介(2学时)第五章数据标注(4学时)第7周
5.2数据标注分类(2学时)
5.3数据标注质量检验(2学时)第五章数据标注(4学时)
5.4图像数据标注实战(2学时)第8周
5.5文本标注实战(2学时)第六章Kettle作业设计(4学时)第9周
6.1作业的概念及组成(2学时)
6.2作业的执行方式(2学时)第六章Kettle作业设计(4学时)第第周
6.3作业的创建及常用作业项(2学时)
6.4变量(2学时)第六章Kettle作业设计(4学时)
6.5监控(2学时)第11周
6.6命令行启动(2学时)第六章Kettle作业设计(2学时)
6.7作业实验(2学时)第12周第七章基于Kettle构建数据仓库(2学时)
7.1数据仓库的介绍(2学时)第七章基于Kettle构建数据仓库(4学时)第13周
7.2构建维度表(2学时)
7.3构建事实表(2学时)第八章基于Python的数据导入与导出(4学时)
8.1Pandas(1学时)第14周
8.2文本文件的导入与导出(2学时)
8.3Excel文件的导入与导出(1学时)第八章基于Python的数据导入与导出(2学时)
8.4数据库的导入与导出(2学时)第第周第九章基于Python的数据整理(2学时)
9.1合并多个数据集(2学时)第九章基于Python的数据整理(4学时)
9.2数据重塑(2学时)第16周
9.3数据转换(2学时)教研室主任签字:教学副院长签字:。