还剩5页未读,继续阅读
文本内容:
《Python数据分析与机器学习》课程教学大纲
一、课程基本信息课程名称Python数据分析与机器学习学分
2、
3、4课时
32、
48、64
二、课程目标本课程采用理论与实践相结合的教学方式,通过学习Python语法基础、numpy数据处理、matplotlib数据可视化技术、pandas数据预处理与分析技术、sklearn机器学习等内容,培养学生数据处理的能力,掌握机器学习的基本流程,并能够利用机器学习的方法挖掘数据中的有用价值,使学生更好地适应大数据和人工智能时代的工作与学习
三、先修课程无
四、教材杨年华,Python数据分析与机器学习,清华大学出版社,2022年9月
五、课程内容
1、Python语言与开发环境概述(2课时)
(1)Python语言的特点、下载与安装、交互与文件两种使用方式(1课时)
(2)代码的风格、模块的概念及其导入方式、帮助的使用、Anaconda环境的安装与使用(1课时)
2、Python语言基础(8课时)
(1)控制台的输入与输出、标识符、变量、赋值语句(1课时)
(2)常用数据类型、运算符、表达式(1课时)
(3)分支结构(2课时)
(4)循环结构(1课时)
(5)常用组合类型(列表、元组、字符串、字典、集合)(2课时)
(6)推导式、用于组合类型的常用内置函数、正则表达式(1课时)
3、函数(5课时)
(1)函数的定义、调用、函数的返回值、位置参数与关键参数(2课时)
(2)默认参数、个数可变的参数、参数与返回值类型注解(2课时)
(3)lambda表达式、函数式编程的常用类与函数(1课时)
4、自定义类与对象(3课时)
(1)Python中的对象与方法、类的定义与对象的创建(1课时)
(2)类的继承(2课时)
5、numpy数据处理基础(6课时)
(1)numpy数据结构、数据的准备、数组的索引与切片(2课时)
(2)改变数组的形状、对角线上元素的替换、插入维度、数组的基本运算、数组的排序、数组的组合、数组的分割(2课时)
(3)随机打乱数组中的元素顺序、多维数组的展开、其他适用于数组的函数与对象、利用numpy进行统计分析、数组在其他文件中的存取(2课时)
6、matplotlib数据可视化基础(6课时)
(1)绘制基本图形、绘制多轴图(2课时)
(2)坐标轴的刻度标签、主次刻度、网格设置、移动坐标轴、文字说明和注释、显示图片、日期作为横坐标(2课时)
(3)绘制横线与竖线、绘制其他二维图表、绘制三维图表(2课时)
7、pandas数据处理与分析(6课时)
(1)数据结构与基本操作、文件与数据库中存取DataFrame对象(2课时)
(2)常用函数与方法(1课时)
(3)DataFrame数据清洗与处理、时间处理(2课时)
(4)移动数据与时间索引、统计分析、pandas中的绘图方法(1课时)
8、机器学习方法概述与数据加载(5课时)
(1)机器学习概述、sklearn简介与安装(1课时)
(2)加载数据、划分训练集与测试集(2课时)sklearn中机器学习的基本步骤示例、sklearn编程接口风格(2课时)
9、数据预处理(3课时)
(1)特征的离散化(1课时)
(2)识别与处理异常值、特征的Min-Max缩放(1课时)
(3)特征值的标准化、特征值的鲁棒缩放、无序分类数据的热编码、有序分类数据的编码、每个样本特征值的正则化(1课时)
10、模型评估与轨道(4课时)
(1)泛华、过拟合、欠拟合的概念;模型评估指标(2课时)
(2)交叉验证(1课时)
(3)轨道的创建与使用(1课时)
11、有监督学习之分类与回归(6课时)
(1)分类与回归概述、线性回归(2课时)
(2)逻辑回归与岭回归实现线性分类、支持向量机用于分类和回归(2课时)
(3)朴素贝叶斯分类、决策树用于分类和回归(2课时)
12、集成学习(4课时)
(1)投票法集成、bagging/pasting集成(2课时)
(2)提升法集成、堆叠法集成(2课时)
13、无监督学习之聚类与降维(4课时)
(1)用k-均值基于相似性聚类、层次聚类、基于密度的聚类(2课时)
(2)聚类性能评估、无监督的降维(2课时)
14、超参数调优与模型选择(4课时)
(1)基于循环语句的网格搜索、划分验证集避免过拟合、带交叉验证的网格搜索、带交叉验证的随机搜索(2课时)
(2)搜索多个不同特征的空间、对轨道中的超参数进行搜索、搜索算法和超参数(2课时)
六、不同学分的课时与教学内容安排建议序号章节名称2学分课时规划2学分课时规划3学分课时规划3学分课时规划4学分课时规划1Python语言与开发环境概述2222Python语言基础8683函数5554自定义类与对象3335Numpy数据处理基础436356Matplotlib数据可视化基础436357Pandas数据处理与分析646468机器学习方法概述与数据加载45459数据预处理232310模型评估与轨道343411有监督学习之分类与回归565612集成学习343413无监督学习之聚类与降维242414超参数调优与模型选择3434合计课时3232484864。