还剩2页未读,继续阅读
文本内容:
学院课程教学进度计划表(20〜20学年第二学期)课程名称网络爬虫技术授课学时学时Python64主讲(责任)教师_________________________参与教学教师_____________________________授课班级/人数____________________________专业(教研室)___________________________填表时间________________________________专业(教研室)主任_______________________教务处编印年月
一、课程教学目的通过本课程的学习,掌握使用基本语法完成爬虫任务编写,使用库向指定网Python Requests址发送请求,或库对静态网页进行解析,库爬取动态页面;使用Xpath BeautifulSoup Selenium JSON文件、数据库、数据库对爬取下来的数据进行存储;使用表单登录方法、MySQL MongoDB Cookie登录方法实现模拟登录;使用和工具抓包,并分析终端协议;使用HTTP AnalyzerFiddler Scrapy框架进行网页内容爬取,理论结合实践,每个章节中都配有多个案例,为学生将来从事数据采集、数据爬取的工作、研究奠定基础
二、教学方法及手段本课程将采用理论与实践相结合的教学方法在理论上,通过任务引入概念、原理和方法在实践上,充分地利用现有的硬件资源,发挥学生主观能动性,指导学生按照、PyCharm.MySQL作为数据爬取的基础环境,使用或者发送请求,使用MongoDB Requestsurllib3Xpath BeautifulSoup或者正则表达式进行页面解析,使用进行动态页面解析,使用文件、数据SeleniumJSON MySQL库或者数据库进行数据存储,使用请求模拟登录网站,使用或者MongoDB POSTHTTP Analyzer工具对终端数据进行爬取,使用框架进行内容爬取解析,引导学生将所学知识与企Fiddler Scrapy业需求相结合,将知识活学活用要求学生自己动手分析实例,学习基本理论和方法,结合已有的知识,适当组织一些讨论,充分调动学生的主观能动性,以达到本课程的教学目的
三、课程考核方法突出学生解决实际问题的能力,加强过程性考核课程考核的成绩构成二平时作业()10%+课堂参与()期末考核()期末考试建议采用开卷形式,试题应包括发送请求、20%+70%,HTTP解析静态网页内容、解析动态网页内容、数据存储为文件、数据存储到数据库、数JSONMySQL据存储到数据库、使用表单和模拟登录、使用获取端数据、MongoDBCookieHTTP AnalyzerPC使用获取端数据、框架使用等部分,题Fiddler APPScrapy泰迪智能科技aTIPOM HHELUGEXTTECHBIOtMV型可采用判断题、选择、简答、编程题等方式《数据分析与应用》教学日历Python周次学时授课内容作业要求备注第章实训,思114第1章了解爬虫与爬虫环境考题,课后习题第章实训思21,24第2章爬虫基础知识准备
(1)考题,课后习题第章爬虫基础知识准备()22第章实训思22,第章简单静态网页爬取一一获取某企业官网基343考题,课后习题本信息()1第章简单静态网页爬取一一获取某企业官网基本第章实训、实33144信息()训22第章简单静态网页爬取一一获取某企业官网基本3第章实训5433信息()3第章简单静态网页爬取一一获取某企业官网基本3第章思考题643信息()4第章简单静态网页爬取一一获取某企业官网3基本信息()一745,‘第3章课后习题第章爬取动态网页一一获取图书基本信息()41第章爬取动态网页一一获取图书基本信息()第章实训844241第章爬取动态网页一一获取图书基本信息()第章实训944342第章思考题、4第章爬取动态网页一一获取图书基本信息()10444课后习题第章模拟登录一一登录某企业官网()第章实训114515第章模拟登录一一登录某企业官网()52第章思考题,5124第6章终端协议分析一一获取某音乐PC客户端和课后习题数据()APP1第章终端协议分析一一获取某音乐客户端和6PC第章实训1346数据()APP2第章终端协议分析一一获取某音乐客户端和6PCAPP数据
(3)第6章思考题,144第7章使用Scrapy爬虫——爬取某企业官网新闻课后习题动态()1第章使用爬虫一一爬取某企业官网新闻动7Scrapy第章实训1547态()2第7章使用Scrapy爬虫一一爬取某企业官网新闻第7章思考题,164动态
(3)课后习题注教材池瑞楠.网络爬虫技术(第版微课版).人民邮电出版社.Python2M[M]
2023.。