还剩10页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
Python数据分析、挖掘与可视化教学大纲院(系、部)计算机科学与技术学院教研室起草人日期年月日15交叉验证与网格搜索教学内容使用交叉验证评估模型泛化能力、使用网格搜索确定模型最佳参数重点、难点cross_val_score函数与GridSearchCV类的用法第9章matplotlib数据可视化实战1数据可视化库matplotlib基础教学内容matplotlib扩展库安装,matplotlib绘图一般过程重点、难点matplotlib扩展库安装绘制折线图实战教学内容折线图绘制原理,折线图适用场景,商场优惠活动商场收益、顾客节省情况折线图,烧烤店营业额折线图,plot函数重点、难点plot函数参数含义绘制散点图实战教学内容散点图绘制原理,散点图适用场景,烧烤店营业额展示,商场内手机信号强度展示,scatter函数重点、难点scatter函数参数含义绘制柱状图实战教学内容柱状图绘制原理,柱状图适用场景,商场各部门业绩展示,烧烤店营业额柱状图展示,集体过马路方式柱状图展示,bar函数参数含义重点、难点bar函数参数含义绘制饼状图实战教学内容饼状图绘制原理,饼状图适用场景,学生成绩饼状图展示,pie函数参数含义重点、难点pie函数参数含义绘制雷达图实战教学内容雷达图绘制原理,雷达图适用场景,学生成绩分布雷达图展示家庭开支雷达图展示,polar函数参数含义重点、难点polar函数参数含义绘制三维图形实战教学内容:三维图形绘制原理,三维折线图与曲面图绘制,三维柱状图绘制三维散点图绘制重点、难点三维图形绘制原理绘图区域切分实战教学内容绘图区域切分原理,创建三维子图,subplot函数参数含义重点、难点subplot函数参数含义设置图例样式实战教学内容图例的作用,legend函数参数含义,图例位置、背景色、分栏等样式设置重点、难点legend函数参数含义
9.10事件响应与处理实战教学内容鼠标进入、移动、离开等事件的响应与处理方式,定时器事件响应与处理,组件单击事件响应与处理,创建动画重点、难点不同类型事件的定义,mpl_connect函数的使用
9.11填充图形教学内容fill和fill_between函数参数含义
9.12保存绘图结果教学内容savefigO函数参数含义,dpi设置,图像文件格式设置
四、课时分配建议课时分配表148+16学时课时分配表2(32+16学时)
一、课程概况3
三、教学内容以及重点、难点3Python开发环境搭建与编码规范3数据类型、运算符与内置函数4列表、元组、字典、集合与字符串4选择结构、循环结构、函数定义与使用5文件操作6numpy数组与矩阵运算6pandas数据分析实战7sklearn机器学习实战8matplotlib数据可视化实战10
五、教材与参考书目
一、课程概况课程名称Python数据分析、挖掘与可视化课程编号课程性质限制性选修考核方式考查建议学时48+16前导课程线性代数、高等数学适用专业计算机科学与技术、数据科学、统计、金融、管理等理工科和商科专业
二、教学目的和要求通过本课程的学习,使得学生能够理解Python的编程模式熟练运用Python内置函数与运算符、列表、元组、字典、集合等基本数据类型以及相关列表推导式、切片、序列解包等语法来解决实际问题,熟练掌握Python分支结构、循环结构、函数设计以及类的设计与使用,掌握numpy数组运算和矩阵运算、pandas基本数据结构以及数据分析与处理、机器学习基本算法原理以及sklearn实现、matplotlib数据可视化与科学计算可视化能够根据问题性质和特点选择合适的机器学习算法,能够根据数据特点选择合适的可视化方式
三、教学内容以及重点、难点第1章Python开发环境搭建与编码规范Python开发环境搭建与使用教学内容在Python官方网站下载安装包并安装,下载并安装Anaconda3IDLE、JupyterNotebook、Spyder简单使用,使用pip和conda命令安装扩展库重点、难点系统环境变量path的设置,安装扩展库2Python编码规范教学内容缩进对业务逻辑的影响,变量命名规则重点、难点缩进的作用
1.3标准库、扩展库对象的导入与使用教学内容导入标准库与扩展库对象的几种形式及其区别,导入标准库和扩展库的顺序重点、难点导入标准库与扩展库对象的几种形式及其区别第2章数据类型、运算符与内置函数常用内置数据类型教学内容整数、实数、复数、列表、元组、字典、集合、字符串等常用数据类型重点、难点数字大小没有限制,实数计算会有误差,字典的键和集合中的元素不允许重复并且必须为不可变类型的数据,包含一个元素的元组必须有逗号运算符与表达式教学内容算术运算符、关系运算符、成员测试运算符、集合运算符、逻辑运算符重点、难点关系运算符可以连用,关系运算符、成员测试运算符和逻辑运算符具有惰性求值的特点,列表、元组、字符串比较大小时逐个比较其中的元素大小直至得出确定的结论,关系运算符作用于集合时表示集合的包含关系而不关心元素大小常用内置函数教学内容类型转换、最大值、最小值、元素数量、求和、排序、逆序、基本输入输出、rangezipmapreducefiltero重点、难点内置函数max、minsorted的key参数可以用来指定排序规则,range函数限定的是左闭右开区间,函数式编程模式综合应用与例题解析列表、元组、字典、集合与字符串列表与列表推导式教学内容创建列表、使用下标访问列表中的元素、列表常用方法、列表推导式、切片操作重点、难点列表、元组、字符串的下标可以是负数,列表推导式,切片限定的是左闭右开区间元组与生成器表达式教学内容元组与列表的区别、生成器表达式、序列解包重点、难点生成器表达式具有惰性求值特点,并且其中的元素只能使用一次,序列解包要求等号两侧值的数量和变量的数量必须相等字典教学内容字典元素访问、字典元素修改、添加与删除重点、难点字典的键可以作为下标,字典的get方法,使用字典的键作为下标的赋值语句的两种含义集合教学内容集合概述、集合常用方法重点、难点集合常用方法字符串常用方法教学内容encode、formatindex、rindex、count、replace、maketrans、translate、1just、rjust、center、split、rsplit、joinloweruppercapitalizetitleswapcasestartswith、endswithstriprstripOIstripo重点、难点:字符串方法返回新的字符串或字节串,不对原字符串进行修改综合应用与例题解析第4章选择结构、循环结构、函数定义与使用1选择结构教学内容条件表达式、单分支选择结构、双分支选择结构、嵌套的分支结构重点、难点条件表达式与True、False的等价关系,嵌套选择结构的代码缩进2循环结构教学内容for循环、while循环、break与continue语句重点、难点带else的for循环和while循环执行逻辑以及break语句的作用函数定义与使用教学内容函数定义基本语法、lambda表达式、递归函数、生成器函数、位置参数、默认值参数、关键参数、可变长度参数、变量作用域重点、难点lambda表达式功能与适用场合,默认值参数,可变长度参数的两种形式,变量作用域综合应用与例题解析第5章文件操作1文件操作基础教学内容内置函数pen、文件对象常用方法、上下文管理语句with重点、难点读写文件时会自动移动文件指针,读写文本文件时一定要注意编码格式JSON文件操作教学内容json模块的函数重点、难点separators参数的作用CSV文件操作教学内容csv模块的用法重点、难点编码格式的影响,4WordExcel、PowerPoint文件操作实战教学内容Word、Excel、PowerPoint文件的内容读取重点、难点python-docxopenpyxlpython-pptx扩展库的安装及其用法第6章numpy数组与矩阵运算1numpy数组及其运算教学内容创建数组、测试两个数组的对应元素是否足够接近、修改数组中的元素值、数组与标量的运算、数组与数组的运算、数组排序、数组的内积运算、访问数组中的元素、数组对函数运算的支持、改变数组形状、数组布尔运算、分段函数、数组堆叠与合并重点、难点数组与标量的运算,相同形状的数组之间的运算,函数对数组的运算,数组布尔运算,分段函数矩阵生成与常用操作教学内容生成矩阵、矩阵转置、查看矩阵特征、矩阵乘法、计算相关系数矩阵、计算方差、协方差、标准差重点、难点矩阵与数组的区别计算特征值与特征向量教学内容矩阵特征值与特征向量的含义,eig函数重点、难点矩阵特征值与特征向量的含义计算逆矩阵教学内容逆矩阵的计算,inv函数重点、难点不是所有矩阵都有逆矩阵求解线性方程组教学内容solve函数计算向量和矩阵的范数教学内容范数的定义与含义,form函数重点、难点向量范数与矩阵范数的区别奇异值分解教学内容奇异值的定义,奇异值分解,svd函数重点、难点奇异值的定义,奇异值分解的意义8函数向量化教学内容普通函数向量化第7章pandas数据分析实战pandas常用数据类型教学内容一维数组与常用操作、时间序列与常用操作、二维数组DataFrameo重点、难点时间序列与常用操作2DataFrame数据处理与分析实战教学内容读取Excel文件中的数据、筛选符合特定条件的数据、查看数据特征和统计信息、按不同标准对数据排序、使用分组与聚合对员工业绩进行汇总、处理超市交易数据中的异常值、处理超市交易数据中的缺失值、处理超市交易数据中的重复值、使用数据差分查看员工业绩波动情况、使用透视表与交叉表查看业绩汇总数据、使用重采样技术按时间段查看员工业绩、多索引相关技术与操作、使用标准差与协方差分析员工业绩、使用pandas的属性接口实现高级功能、绘制各员工在不同柜台业绩平均值的柱状图、查看DataFrame的内存占用情况、数据拆分与合并重点、难点:sort_index、sort_values、groupby、fillna、diff、pivotcrosstabresample等函数或方法的用法,聚合函数的作用,属性接口第8章sklearn机器学习实战1机器学习基本概念教学内容样本、特征、特征向量、目标、偏差、方差、拟合、过拟合、数据泄露、有监督学习、半监督学习、无监督学习、分类器、聚类器、离群点检测器、预测器、损失函数、泛化、正则化等基本概念2机器学习库sklearn简介教学内容扩展库sklearn常用模块与对象,如何选择合适的模型和算法线性回归算法原理与应用教学内容线性回归模型原理、sklea门1中线性回归模型的简单应用、岭回归原理与sklearn实现、套索回归Lasso基本原理与sklearn实现、弹性网络基本原理与sklearn实现、使用线性回归模型预测儿童身高重点、难点岭回归、套索回归、弹性网络的区别,正则化的作用逻辑回归算法原理与应用教学内容逻辑回归算法原理与sklearn实现、使用逻辑回归算法预测考试能否及格重点、难点逻辑回归算法算法与sklearn实现朴素贝叶斯算法原理与应用教学内容朴素贝叶斯算法基本概念、朴素贝叶斯算法分类原理与sklearn实现、使用朴素贝叶斯算法对中文邮件进行分类重点、难点朴素贝叶斯算法分类原理与sklearn实现,中文分词,特征向量的构造决策树与随机森林算法应用教学内容决策树算法基本概念、原理与sklearn实现、随机森林算法原理与sklearn实现、使用决策树算法判断学员的Python水平重点、难点决策树与随机森林算法基本原理支持向量机算法原理与应用教学内容支持向量机算法基本原理与sklearn实现、使用支持向量机对手写数字图像进行分类重点、难点支持向量机算法基本原理及参数含义,图像文件内容的读取KNN算法原理与应用教学内容KNN算法基本原理与sklearn实现、使用KNN算法判断交通工具类型重点、难点KNN算法基本原理
8.9KMeans聚类算法原理与应用教学内容KMeans聚类算法基本原理与sklearn实现、使用KMeans算法压缩图像颜色重点、难点KMeans聚类算法基本原理
8.10分层聚类算法原理与应用教学内容分层聚类算法原理与应用
8.11DBSCAN算法原理与应用教学内容核心样本、边界样本、噪声样本、密度可达等基本概念,DBSCAN算法原理与应用重点、难点DBSCAN算法原理
8.12使用协同过滤算法进行电影推荐教学内容协同过滤算法原理,电影推荐重点、难点协同过滤算法
8.13关联规则分析原理与应用教学内容关联规则分析原理与基本概念、使用关联规则分析演员关系重点、难点关联规则分析原理
8.14数据降维教学内容数据降维的作用,主成分分析基本原理重点、难点主成分分析原理章节名称课堂学时实验学时课外学时第1章Python开发环境搭建与编码规范22第2章数据类型、运算符与内置函数46第3章列表、元组、字典、集合与字符串46第4章选择结构、循环结构、函数定义与使用46第5章文件操作22第6章numpy数组与矩阵运算646第7章pandas数据分析实战846第8章sklearn机器学习实战1046第9章战matplotlib数据可视化实846章节名称课堂学时实验学时课外学时第1章Python开发环境搭建与编码规范22第2章数据类型、运算符与内置函数28第3章列表、元组、字典、集合与字符串28第4章选择结构、循环结构、函数定义与使用28第5章文件操作24第6章numpy数组与矩阵运算448第7章pandas数据分析实战648第8章sklearn机器学习实战648第9章matplotlib数据可视化实战648。