还剩6页未读,继续阅读
文本内容:
附件1广东财经大学华商学院课程教学大纲《大数据概论》课程教学大纲:课程名称•大数据概论•:课程编码1!课程类型享科基础课0822312;合用范围计算机科学与技术,软件工程,鹏子:课程性质专业选修课;商务学分数2先修课程学时数36实验/实践学时_____________________________无考试课外学时无考核方式••14______________J[制定单数据科学学院制订日期2022年03月!位,j___________________i卜-___________::执笔者T,颜远海;审核者1-----—-----------------------t--------▲•---------------------------------------------------------------------------------.--------------------------------
一、课程简介大数据概论是一门理论性和实践性都很强的课程,针对计算机、信息管理和其他各专业学生的发展需求,系统、全面地介绍了关于大数据技术与应用的基本知识和技能,详细介绍了大数据与大数据时代、大数据的可视化、大数据的商业规则、大数据时代的思维变革、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据促进学习、大数据在云端、支撑大数据的技术、数据科学与数据科学家、大数据的未来等内容,具有较强的系统性、可读性和实用性
二、教学目标
(一)目的与要求本课程是大数据系列课程的基础,系统地介绍大数据涵盖的内容,包括数据与大数据概述、大数据获取与感知、大数据存储与管理、大数据分析、大数据处理、大数据管理、大数据安全与隐私等除了介绍大数据的技术内容,课程还介绍了部份行业中大数据的典型应用案例,反映了大数据在社会经济生活中的重要价值从而达到四个方面的对于大数据的认识:认识数据与大数据、认识大数据带来信息化第三波浪潮、认识大数据对现有信息技术体系的挑战、认识亟待构建的大数据管理体系课程基本要求1了解本课程的教学设计;2熟悉本课程的基本内容与学习要求;3主动完成本章的导读案例、思量和阅读全部内容
二、主要教学模式和教学手段采用线下教学为主,线上教学为辅主要学习模式课堂面授课程,通过常用的工具进行实践教学,线上教学为辅,选择合适的教学平台进行线上补充教学主要教学方法1问题导向法2对照教学法3讨论教学法4任务驱动法主要教学手段1多媒体机房教学2在线课程教学3视频教学网站
四、教学内容要求编写所有章节的主要内容第一章什么是大数据内容:
1.1人类信息文明的发展
1.2大数据时代的来临
1.
2.1信息技术的发展
1.
2.2数据产生方式的变革
1.3大数据的主要特征
1.
3.1大数据的数据特征
1.
3.2大数据的技术特征
1.4大数据的社会价值熟练掌握了解人类信息文明的发展历程熟悉大数据时代的来临和具体发展表现掌握大数据的主要特征掌握大数据的社会价值第二章大数据技术基础内容
2.1计算机操作系统
2.
1.1什么是操作系统
2.
1.2Linux操作系统
2.2编程语言
2.
2.1编程语言的发展与种类
2.
2.2Python语言
2.3数据库
2.
3.1SQL数据库的发展与成熟
2.
3.2NoSQL数据库及其特点
2.
3.3NoSQL数据库的分类
2.
3.4NewSQL数据库
2.4算法
1.
4.1什么是算法
1.
4.2大数据时代的算法
2.5大数据系统
3.
5.1Hadoop平台
4.
5.2Spark平台
5.6大数据的数据类型
6.
6.1结构化数据
7.
6.2半结构化数据
8.
6.3非结构化数据
9.7大数据应用的开辟流程
10.数据科学算法的应用流程熟练掌握掌握计算机操作系统的基础知谡理解和掌握编程语言掌握数据库的主要数据类型理解算法的涵义掌握大数据系统熟悉大数据应用开辟流程第三章数据采集与预处理内容
1.1大数据的来源
1.
1.1传统商业数据
1.
1.2互联网数据
1.
1.3物联网数据
2.2数据的采集方法
3.
2.1系统日志的采集方法
4.
2.2网页数据的采集方法
5.
2.3其他数据的采集方法
6.3数据预处理
7.
3.1影响数据质量的因素
8.
3.2数据预处理的目的
9.
3.3数据预处理的流程熟练掌握了解大数据的来源掌握数据的采集方法掌握数据预处理流程了解大数据的来源掌握数据的采集方法与数据预处理的主要流程第4章数据存储与管理内容
4.1数据存储概述
4.
1.1数据的存储介质
4.
1.2数据的存储模式
4.2大数据时代的存储管理系统
4.
2.1文件系统
1.
1.
12.2分布式文件系统
4.
2.3数据库
4.
2.4键-值数据库
4.
2.5分布式数据库
4.
2.6关系型数据库
4.
2.7数据仓库
4.
2.8文档数据库
4.
2.9图形数据库
10.
2.10云存储熟练掌握团掌握数据的存储模式团理解并掌握大数据时代的存储管理系统团理解数据存储的概念和种类团熟练掌握常用的3种数据存储模式团理解分布式平台存储大数据的意义和优势,掌握分布式文件系统基础架构第五章大数据计算框架内容:
5.1计算框架
5.
1.1批处理框架
5.
1.2流式处理框架
5.
1.3交互式处理框架
5.2MapReduce
5.
2.1MapReduce编程的特点
5.
2.2MapReduce的计算模型
11.
2.3MapReduce的资源管理框架
5.3Spark
5.
3.1Spark的基本知识
6.
3.2Spark的生态系统
7.
3.3Spark的架构与原理
8.
3.4Spark RDD的基本知识熟练掌握团理解并掌握MapReduce的计算模型、资源管理框架和编程特点团掌握Spark的基本知识、基本特点和架框原理团理解处理框架按照所处理的数据状态分为批处理框架、流式处理框架及交互式处理框架3种计算框架团掌握MapReduce的计算模型、资源管理框架和编程特点团理解并掌握Spark的基本知识、生态系统、基本特点和架框原理第六章数据挖掘内容:
8.1什么是数据挖掘
9.2数据挖掘的对象与价值
12.
2.1数据挖掘的对象
13..2数据挖掘的价值
6.3数据挖掘常用的技术
6.
3.1关联分析
7.
3.2分类分析
8.
3.3聚类分析
9.4数据挖掘常用的工具
6.
4.1RapidMiner
7.
4.2WEKA
8.
4.3Orange
9.
4.4R语百
10.
4.5Mining
6.5数据挖掘的典型应用
6.
5.1社交媒体领域的应用
7.
5.2市场营销领域的应用
8.
5.3科学研究领域的应用
9.
5.4电信领域的应用
10..5教育领域的应用
11.
5.6医学领域的应用第章数据可视化7内容
12.1什么是可视化
11.
1.1可视化的含义
12..2可视化的发展历程
13.
1.3可视化的作用
14.数据可视化及其分类
7.
2.1科学可视化
8.
2.2信息可视化
9.
2.3可视化分析学
2.3数据可视化工具
7.
3.1入门级工具
8.
3.2信息图表工具
9.
3.3地图工具
10..4高级分析工具
2.4数据可视化案例
7.
4.1数字美食
8.
4.2空中的间谍
五、教学重点难点教学重点关联规则、降维、特征选择、EM算法、概率图模型等内容,最后介绍自然语言处理与文本分析、图与网络分析、分布式计算和深度学习等知识教学重点关联规则、降维、特征选择、EM算法、概率图模型等内容,最后介绍自然语言处理与文本分析、图与网络分析、分布式计算和深度学习等知识线性回归正则化,非线性回归方法,文本表示方法,主题模型和LDAo
六、各教学环节学时分配教学内容各教学环节学时分配讲其小章节主要内容上实验讨论习题官计弟一早什么是大数据400004第二章大数据技术基础201104第三章数据采集与预处理400004第四章数据存储与管理301004第五章大数据计算框架301004第六章数据挖掘500106第七章数据可视化400104合计30
八、本课程与其他课程的联系
1.先修课程无
2.后续课程大数据预处理技术,大数据技术与应用,数据挖掘与算法
九、推荐教材和教学参考书《大数据导论》,杨尊琦主编,机械工业出版社.参考书:
[1]维克托-迈尔-舍恩伯格,肯尼思・库克耶.大数据时代生活、工作与思维的大变革.盛杨燕等译.杭州浙江人民出版社,
2022.
[2]《大数据导论一一数据思维、数据能力和数据伦理(通识课版)》林子雨编著,高等教育出版社,2022年11月
[3]《大数据概论》,陈明主编,科学出版社出版
[4]《云计算与大数据概论》,青岛英谷教育科技股分有限公司,西安电子科技大学出版社.
[5]《大数据导论》,周苏、王文主编,清华大学出版社.。