还剩6页未读,继续阅读
文本内容:
附件1广东财经大学华商学院课程教学大纲《大数据概论》课程教学大纲课程名称大数据概论0822312课程类型学科基础课课程编码计算机科学与技术,软件工程,电子课程性质专业选修课适用范围商务2学分数先修课程无36学时数实验/实践学时无考试课外学时无考核方式(平时40%+实验0%+期末60%)制订单位数据科学学院制订日期2019年03月颜远海执笔者颜远海审核者
一、课程简介大数据概论是一门理论性和实践性都很强的课程,针对计算机、信息管理和其他各专业学生的发展需求,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据的可视化、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家、大数据的未来等内容,具有较强的系统性、可读性和实用性
二、教学目标
(一)目的与要求本课程是大数据系列课程的基础,系统地介绍大数据涵盖的内容,包括数据与大数据概述、大数据获取与感知、大数据存储与管理、大数据分析、大数据处理、大数据治理、大数据安全与隐私等除了介绍大数据的技术内容,课程还介绍了部分行业中大数据的典型应用案例,反映了大数据在社会经济生活中的重要价值从而达到四个方面的对于大数据的认识:认识数据与大数据、认识大数据带来信息化第三波浪潮、认识大数据对现有信息技术体系的挑战、认识亟待构建的大数据治理体系课程基本要求1了解本课程的教学设计;2熟悉本课程的基本内容与学习要求;3主动完成本章的导读案例、思考和阅读全部内容
二、主要教学模式和教学手段采用线下教学为主,线上教学为辅主要学习模式课堂面授课程,通过常用的工具进行实践教学,线上教学为辅,选择合适的教学平台进行线上补充教学主要教学方法1问题导向法2对比教学法3讨论教学法4任务驱动法主要教学手段1多媒体机房教学2在线课程教学3视频教学网站
四、教学内容要求编写所有章节的主要内容第一章什么是大数据内容
1.1人类信息文明的发展
1.2大数据时代的来临
1.
2.1信息技术的发展
1.
2.2数据产生方式的变革
1.3大数据的主要特征
1.
3.1大数据的数据特征
1.
3.2大数据的技术特征
1.4大数据的社会价值熟练掌握了解人类信息文明的发展历程熟悉大数据时代的来临和具体发展表现掌握大数据的主要特征掌握大数据的社会价值第二章大数据技术基础内容
2.1计算机操作系统
2.
1.1什么是操作系统
2.
1.2Linux操作系统
2.2编程语言
2.
2.1编程语言的发展与种类
2.
2.2Python语言
2.3数据库
2.
3.1SQL数据库的发展与成熟
2.
3.2NoSQL数据库及其特点
2.
3.3NoSQL数据库的分类
2.
3.4NewSQL数据库
2.4算法
2.
4.1什么是算法大数据时代的算法
2.5大数据系统
2.
5.1Hadoop平台
2.
5.2Spark平台
2.6大数据的数据类型结构化数据
2.
6.2半结构化数据
2.
6.3非结构化数据
2.7大数据应用的开发流程
2.8数据科学算法的应用流程熟练掌握掌握计算机操作系统的基础知识理解和掌握编程语言掌握数据库的主要数据类型理解算法的涵义掌握大数据系统熟悉大数据应用开发流程第三章数据采集与预处理内容
1.1大数据的来源
1.
1.1传统商业数据
1.
1.2互联网数据
1.
1.3物联网数据
1.2数据的采集方法
1.
3.1系统日志的采集方法
1.
4.2网页数据的采集方法
1.
5.3其他数据的采集方法
2.3数据预处理
3.
3.1影响数据质量的因素
4.
3.2数据预处理的目的
5.
3.3数据预处理的流程熟练掌握了解大数据的来源掌握数据的采集方法掌握数据预处理流程了解大数据的来源掌握数据的采集方法与数据预处理的主要流程第4章数据存储与管理内容
5.1数据存储概述
6.
1.1数据的存储介质
7.
1.2数据的存储模式
2.2大数据时代的存储管理系统
4.
2.1文件系统
5.
2.2分布式文件系统
6.
2.3数据库
7.
2.4键-值数据库
8.
2.5分布式数据库
9.
2.6关系型数据库
10..7数据仓库
11.
2.8文档数据库
12.
2.9图形数据库
4.
2.10云存储熟练掌握0掌握数据的存储模式0理解并掌握大数据时代的存储管理系统0理解数据存储的概念和种类0熟练掌握常用的3种数据存储模式0理解分布式平台存储大数据的意义和优势,掌握分布式文件系统基础架构第五章大数据计算框架内容
4.1计算框架
5.
1.1批处理框架
5.
1.2流式处理框架
13.
1.3交互式处理框架
5.2MapReduce
5.
2.1MapReduce编程的特点
6.
2.2MapReduce的计算模型
7.
2.3MapReduce的资源管理框架
8.3Spark
9.
3.1Spark的基本知识
10.
3.2Spark的生态系统
11.
3.3Spark的架构与原理
12.
3.4Spark RDD的基本知识熟练掌握:0理解并掌握MapReduce的计算模型、资源管理框架和编程特点0掌握Spark的基本知识、基本特点和架框原理0理解处理框架按照所处理的数据状态分为批处理框架、流式处理框架及交互式处理框架3种计算框架0掌握MapReduce的计算模型、资源管理框架和编程特点0理解并掌握Spark的基本知识、生态系统、基本特点和架框原理第六章数据挖掘内容
12.1么是数据挖掘
12.2据挖掘的对象与价值
13.
2.1数据挖掘的对象
14.
2.2数据挖掘的价值
6.3数据挖掘常用的技术
6.
3.1关联分析
6.
3.2分类分析
6.
3.3聚类分析
6.4数据挖掘常用的工具
6.
4.1RapidMiner
6.
4.2WEKA
7.
4.3Orange
8.
4.4R语言
9.
4.5Mining
10.数据挖掘的典型应用
6.
5.1社交媒体领域的应用
7.
5.2市场营销领域的应用
8.
5.3科学研究领域的应用
9.
5.4电信领域的应用
10.
5.5教育领域的应用
11.
5.6医学领域的应用第7章数据可视化内容
11.1么是可视化
11.
1.1视化的含义
11.
1.2视化的发展历程
11.
1.3视化的作用
11.2据可视化及其分类
7.
2.1科学可视化
12.
2.2信息可视化
13..3可视化分析学
2.3数据可视化工具
7.
3.1入门级工具
8.
3.2信息图表工具
9.
3.3地图工具
10..4高级分析工具
2.4数据可视化案例
7.
4.1数字美食
8.
4.2空中的间谍
五、教学重点难点教学重点关联规则、降维、特征选择、EM算法、概率图模型等内容,最后介绍自然语言处理与文本分析、图与网络分析、分布式计算和深度学习等知识教学重点关联规则、降维、特征选择、EM算法、概率图模型等内容,最后介绍自然语言处理与文本分析、图与网络分析、分布式计算和深度学习等知识线性回归正则化,非线性回归方法,文本表示方法,主题模型和LDA
六、各教学环节学时分配教学内容各教学环节学时分配章节主要内容讲授实验习题其它小计E1AA-____jair.第一早什么是大数据400004弟一早大数据技术基础201104第三章数据采集与预处理400004第四章数据存储与管理301004第五章大数据计算框架
301004、一弟八早/rA-数据挖掘500106第七章数据可视化400104合计30
八、本课程与其他课程的联系
1.先修课程无
2.后续课程大数据预处理技术,大数据技术与应用,数据挖掘与算法
九、推荐教材和教学参考书教材《大数据导论》,杨尊琦主编,机械工业出版社.参考书
[1]维克托•迈尔-舍恩伯格,肯尼思•库克耶.大数据时代生活、工作与思维的大变革.盛杨燕等译.杭州浙江人民出版社,
2013.
[2]《大数据导论一一数据思维、数据能力和数据伦理(通识课版)》林子雨编著,高等教育出版社,2019年11月
[3]《大数据概论》,陈明主编,科学出版社出版
[4]《云计算与大数据概论》,青岛英谷教育科技股份有限公司,西安电子科技大学出版社.
[5]《大数据导论》,周苏、王文主编,清华大学出版社.。