还剩49页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
2022数据采集与处理■题库带答案
1、()是指对客观事件记录的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合A、数据B、字段C、记录D、大数据答案A
2、在数据表中,表的“列”称为()A、数据B、字段C、记录D、大数据答案B
3、在数据表中,表的“行”称为()A、数据B、字段C、记录D、大数据答案C
4、数据表是由行(记录)和列(字段)构成,因此也称(A、数据B、二维表C、表格D、大数据答案B
5、大数据具有以下特征
72、登录采集分登录采集和登录采集答案账号密码;Cookie
973、使用登录采集时,输入账号密码需要用到模块答案输入文字*
974、采集器无法识别验证码答案错误
75、登录利用浏览器中的缓存设置,缓存了当前的一个网页状态,可以快速进入当前状态的页面答案Cookie
976、Cookie登录的方式不需要输入账号和密码,直接打开网页就是登录状态答案正确77Cookie登录中Cookie长期存在,所以是登录采集中,最方便的采集方式答案错误
78、使用简易模式采集任意网站数据要求叙述采集步骤或使用采集器采集数据截图答案解析
79、使用单页采集模式,采集任意一个网页的数据要求叙述采集步骤或使用采集器采集数据截图答案解析
80、ajax即、异步更新的一种脚本技术答案延时加载
981、ajax可以通过在后台与服务器进行少量数据交换,可以重新加载整个网页答案错误
82、使用ajax技术的网页,点击网页中某个按钮或下拉页面,网址一般不发生改变,网址栏不出现加载状态,但网页局部有新的数据加载出来,有所变化答案正确
83、Ajax技术包括()A、ajax点击B、ajax翻页C、ajax滚动D、定位答案ABC
84、Ajax点击可以对一个按钮进行多次点击答案错误
85、如果设置了ajax技术的网页,在采集设置时,没有勾选ajax加载,则不能进行采集答案错误
86、Ajax滚动包括()A、直接滚动到底部B、动到下一行C、滚动到下一页D、向下滚动一屏答案AD
87、XPath语言是网页内容定位语言,它可以帮助采集工具查找网页内容在网页中的位置答案正确
88、XPath语言,也称为HTML路径语言答案错误
89、XPath语言由、、、内容构成答案名称;位置;属性
990、被设计用来显示网页数据,就是用来在HTML中定位元素的答案HTML;XPath
991、HTML称为超文本标记语言答案正确
92、是构成网页的基本元素答案节点
993、节点有多种类型,分别是()A、元素、属性、文本B、命名空间、处理指令C、注释、文档节点D、属性值答案ABC
94、节点关系是指节点与节点之间的关系,通过包含与被包含关系区分答案正确
95、是对于节点的描述性语句,用来选取指定节点答案路径表达式XPath中,表示不论该元素在Html中的任何位置,均选取该元素答案//・
97、XPath中,用于选择某一元素的子元素,不能跨多层关系进行选择答案
98、XPath中,用来表示属性,需写在属性前方答案@*
999、XPath中,选取父元素,其中表示父元素选取元素自身,其中“.”表示元素自身答案*9100XPath中,选取某元素下的所有子元素答案
101、XPath中,选取某元素下的所有后代元素答案://*
102、XPath中,用来查找某个特定的节点或包含某个指定的值的节点答案谓语
9103、XPath中,谓语对元素的、及做限制,只要符合限制的元素,使用中括号“[]”表示答案位置;属性;内容104XPath中,Text函数,主要功能为选中指定文本内容的元素答案正确
105、XPath中,contains参数1参数2主要功能为选中参数1中包含参数2中内容的元素答案正确
106、XPath中,last主要功能为选中同胞元素中最后一位的元素答案正确
107、XPath中,position主要功能为描述元素在同胞元素中的位置答案正确
108、哪些行业需要用到数据采集A、企业B、政府C、金融D、教育答案ABCD
109、使用采集器采集需要大量的专业知识答案错误
110、个人进行数据采集是,主要用于()A、网页信息收集B、商务数据采集C、市场数据采集D、社会公开信息答案AB
111、在公安经侦领域通过对网络敏感信息监控比对管理,帮助公安经济侦查工作的开展和提供数据层面的支持答案正确
112、商务数据采集多用于采购分析、市场分析、项目运行和论文编写答案正确
113、数据的质量因素包括可信性和可解释性答案准确性浣整性;一致性;时效性湘关性
9114、数据的质量问题从采集的角度划分,可分为()A、准确性B、完整性C、一致性D、时效性答案ABC
115、数据的质量问题从应用的角度划分,可分为()A、准确性B、相关性C、时效性D、可信性答案BC
116、数据的质量问题从用户使用的角度划分,可分为()A、准确性B、完整性C、可信性D、可解释性答案CD
117、准确性是指数据是否正确的,数据存储在数据库中的值是否对应于真实世界的值答案正确
118、某用户在使用支付宝绑定银行卡时,网站要求验证用户的真实姓名和身份证号码这时要求采集的数据必须有()A、准确性B、完整性C、一致性D、相关性答案A
119、数据质量完整性是指信息具有一个实体描述的所有必需的部分答案正确
120、空值是指缺失或不知道具体的值,可能是一条记录中的某个属性缺失,也可能是整条记录都丢失答案正确
121、数据质量的数据一致性是指在数据库中,不同表中存储和使用的同一数据应当是等价的,表示数据有相等的值和相同的含义答案正确
122、数据质量的数据相关性是指数据与特定的应用和领域有关答案正确
123、数据质量的时效性是指有些数据会随时间而变化的答案正确
124、数据质量的可信性由三个因素决定数据来源的权威性、数据的规范性、数据产生的时间答案正确
125、数据质量的可解释性,也称为可读性,是指数据被人理解的难易程度答案正确
126、数据处理的4大流程步骤中的一个大体流向图,就是()A、数据清理B、数据集成C、数据变换D、数据归约答案ABCD
127、由于操作员重复录入,并发处理等不规范的操作,导致产生不完整,不准确的,无效的数据也可以用在数据分析里答案错误
128、数据的缺失值是指现有数据集中某个或某些属性的值时不完整的答案正确
129、处理空缺值的基本方法有6种,包括忽略元组、人工填写空缺值、使用全局常量替换空缺值、使用属性的中心度量填充空缺值、使用与给定元组属同一类的所有样本的平均值来填充空缺值、使用最可能的值填充空缺值答案正确
130、若一条记录中有多个属性值被遗漏了,则可将该记录排除在数据挖掘之外答案正确
131、噪声数据是指一个测量变量中的随机错误或偏差答案正确
132、噪声数据也可以用于数据挖掘进行分析答案错误
133、孤立点的是不符合数据模型的数据答案正确
134、孤立点并不真实存在,是人们无意中弄出的偏差比较大的数据答案错误
135、处理噪声数据可以使用()方法A、分箱法B、回归法C、聚类D、忽略元组答案ABC
136、数据集成是指将互相关联的分布式异构数据源集成到一起,使用户能够以透明的方式访问这些数据源答案正确
137、数据集成的方法有()A、联邦数据库B、中间件集成C、数据仓库D、聚类答案ABC
138、数据仓库是数据集成最常用的方法答案正确
139、数据仓库来集成数据时需要处理的问题包括()A、实体识别B、冗余C、相关分析D、数据冲突和检测答案ABCD
140、实体识别,它所解决的问题是如何匹配多个信息源在现实世界中的实体事物答案正确
141、数据规约就是为了压缩数据量,帮助从原有庞大数据集中获得一个精简的数据集合,并使这一精简数据集保持原有数据集的完整性答案正确
142、数据规约的策略有()A、维归约B、数量归约C、数据压缩D、实体识别答案ABC
143、主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标答案正确
144、属性子集选择,主要用于检测并删除不相关、弱相关或冗余的属性目的是找出最小属性集,使得数据类的概率分布尽可能地接近使用所有属性得到的原分布答案正确
145、数量规约中有参数的方法一般使用()A、回归B、对数的线性模型C、直方图D、聚类)A、大容量、多种类、高速度B、复杂性、高价值C、可变性、真实性D、以上都是答案D
6、数据的获取途径有()A、产品自有数据B、调查问卷C、互联网数据导入D、从别人数据库窃取答案ABC
7、产品自有数据就是自身产品销售过程中产生的数据答案正确
8、调查问卷是以问题的形式系统的记载调查内容的一种印件答案正确
9、互联网数据分布在网页的不同位置,我们很难采集下来答案错误
10、Excel是按照数据结构来组织,存储和管理数据的仓库答案错误
11、商务数据指用户在电子商务网站购买商品的过程中,网站记录用户行为的大量数据答案正确
12、商务数据包括()A、电子商务平台的基础数据B、电子商务专业网站的研究数据C、电子商务媒体报道D、评论数据答案ABCD答案AB
146、数量规约中无参数的方法一般使用()A、直方图B、聚类C、抽样D、数据立方体聚集答案ABCD
147、数据变换是将数据转换或统一成易于进行数据挖掘的数据存储形式,使得挖掘过程可能更有效答案正确
148、数据变换的方法有很多种,包括光滑、属性构造、聚集、数据规范化、数据离散化、概念分层等答案正确
149、数据规范化包括()A、最大-最小规范化B、零-均值规范化C、小数定标规范化D、数据离散化答案ABC使用简易模式采集任意网站数据要求叙述采集步骤或使用采集器采集数据截图答案151ETL全称为Extraction-Transformation-Loading中文名为数据抽取、转换和加载答案正确
152、安装kettle必须先安装jdk(java的运行环境)答案正确
153、安装jdk之后需要配置环境变量才能使用答案正确
154、ETL是Kettle的一种工具答案错误
155、()是转换里的基本组成部分它是一个图形化的组件,可以通过配置步骤的参数,使得它完成相应的功能A、步骤B、跳C、注释D、转换答案A
156、Kettle中的()定义了一个单向通道,允许数据从一个步骤向另一个步骤流动A、步骤B、跳C、注释D、转换答案B
157、csv、txt文件等都属于文本文件答案正确
158.Excel的数据可分为结构化的表格数据和非结构化的表格数据答案正确
159、Excel是一种()A、办公软件B、开发软件C、操作系统软件D、数据库答案A
160、Excel文件在kettle中可使用()步骤,进行excel的输入输出A、excel输入B、excel输出C、MicrosoftExcel输出D、Micros代Excel输入答案ABC
161、“MicrosoftExcel输出”步骤则可以设置Excel97文件或Excel2007版本的文件的输出答案正确
162、“Excel输出”步骤仅能输出Excel97版本的文件答案正确
163、JSON(JavaScriptObjectNotationJS对象简谱)是一种轻量级的数据交换格式答案正确
164、JSON核心概念包括()A、数组B、对象C、属性D、路径答案ABC
165、JsonPath表达式通常是用来路径检索或设置Json的答案正确
166、JsonPath表达式有两种表示方法,分别是()A、点记法B、括号记法C、逗号记法D、操作符记法答案AB167XML指可扩展标记语言ExtensibleMarkupLanguageXML被设计用来传输和存储数据答案正确168XPath即为XML路径语言XMLPathLanguage它是一种用来确定XML文档中某部分位置的语言答案正确
169、数据库分为关系型数据库和非关系型数据库答案正确
170、MySQL数据的连接参数与Oracle的连接参数是完全相同的答案错误171连接名称是设定一个在作业或转换范围内唯一的名称答案正确
172、数据库连接步骤中在列表里可以选择可用的访问方式有A、JDBC连接B、ODBC数据源C、JNDI数据源D、Oracle的0CI连接答案ABCD
173、数据库连接时,一般连接参数包括A、主机名B、数据库名C、端口号D、用户名和密码答案ABCD
174、数据清理,就是试图检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,去除空白数据域和知识背景下的白噪声,解决数据的一致性、唯一性问题,从而达到提高数据质量的目的答案正确
5、Kettle只能用单一的清洗步骤清洗工作,所以比较麻烦答案错误
176、常用的转换步骤一般在()A、转换目录B、脚本目录C、校验目录D、输出目录答案ABC
177.字符串做剪切的功能,该步骤需要在剪切字符串版面添加需要剪切的(A、字符串字段(输入流字段)B、输出字段(输出流字段)C、剪切的起始位置D、剪切的结束位置答案ABCD
178、字符串替换(Replaceinstring)步骤对字符串做查找替换答案正确
179、字符串操作功能包括()A、首尾去除空白字符B、大小写C、数字移除/提取D、删除特殊字符答案ABCD)
180、能使用正则表达式的是()A、字符串剪切B、字符串替换C、字符串操作D、以上都不行答案B
181、拆分字段成多行Splitfiledtorows可将一行记录拆分成多行记录,新的记录里有一个新的字段,由拆分后的子字符串填充答案正确
182、拆分字段SplitFields根据分隔符将输入的一个字段拆分成多个字段答案正确
183、合并字段ConcatFields将多个字段用分隔符连接起来输出到一个新的字段答案正确
184、字段选择Selectvalues可以对输入流的字段做选择、删除、重命名等操作,还可以更改字段的数据类型和精度等答案正确
185、字段选择Selectvalues有3个选项卡A、选择和修改B、移除C、元数据D、替换答案ABC
186、计算器步骤是一个函数集合来创建新的字段,还可以设置字段是否移除临时字段答案正确
187、流查询在查询前把数据都加载到内存中,并且只能进行等值查询答案正确
188、过滤记录让数据流从一路到两路答案正确
189、重复数据产生原因有A、录入出错B、数据不完整C、数据缩写D、硬件设备出错答案ABC
190、不完全重复数据,客观上表示现实世界中的同一实体,但由于表达方式不同或拼写错误等原因,导致数据存在了多条重复记录答案正确
191、“唯一行(哈希值)”步骤可以附加比较存储在内存中的记录值,防止哈希碰撞冲突答案正确
192、”唯一行(哈希值)”步骤必须先使用排序,不然无法去重答案错误
193、“去除重复记录”步骤要求输入的数据是事先排好序的,因为它是通过比较相邻记录的值来判断是否重复的答案正确
194、一个作业包括一个或多个作业项,这些作业项以某种顺序来执行答案正确
195、作业的组成包括()A、作业项B、作业跳C、注释D、输入答案ABC
196、作业项结果有两个作用,一是决定作业的执行路径,二是向下一个作业项传递一个结果对象答案正确
197、作业跳是作业项之间的连接线,定义了作业的执行路径答案正确
198、在Kettle里,作业是使用一种回溯算法来执行作业里所有作业项的答案正确
199、作业的执行结果是唯一的答案错误
200、作业中的变量代表一个任意长度的字符串值答案正确
201、变量的格式是${变量名}或者%%变量名%%答案正确
202、数据的质量因素包括、、、、可信性和可解释性答案准确性;完整性;一致性;时效性;相关性
203、数据的质量问题从采集的角度划分,可分为()A、准确性B、完整性C、一致性D、时效性答案ABC
204、数据的质量问题从应用的角度划分,可分为()A、准确性B、相关性C、时效性D、可信性答案BC
205、数据的质量问题从用户使用的角度划分,可分为()、A、准确性B、完整性C、可信性D、可解释性答案CD
206、准确性是指数据是否正确的,数据存储在数据库中的值是否对应于真实世界的值答案正确
207、某用户在使用支付宝绑定银行卡时,网站要求验证用户的真实姓名和身份证号码这时要求采集的数据必须有()A、准确性B、完整性C、一致性D、相关性答案A
208、数据质量完整性是指信息具有一个实体描述的所有必需的部分答案正确
209、空值是指缺失或不知道具体的值,可能是一条记录中的某个属性缺失,也可能是整条记录都丢失答案正确
210、数据质量的数据一致性是指在数据库中,不同表中存储和使用的同一数据应当是等价的,表示数据有相等的值和相同的含义答案正确
211、数据质量的数据相关性是指数据与特定的应用和领域有关答案正确
212、数据质量的时效性是指有些数据会随时间而变化的答案正确
213、数据质量的可信性由三个因素决定数据来源的权威性、数据的规范性、数据产生的时间答案正确
214、数据质量的可解释性,也称为可读性,是指数据被人理解的难易程度答案正确
215、数据处理的4大流程步骤中的一个大体流向图,就是()A、数据清理B、数据集成C、数据变换D、数据归约答案ABCD
216、由于操作员重复录入,并发处理等不规范的操作,导致产生不完整,不准确的,无效的数据也可以用在数据分析里答案错误
217、数据的缺失值是指现有数据集中某个或某些属性的值时不完整的答案正确
218、处理空缺值的基本方法有6种,包括忽略元组、人工填写空缺值、使用全局常量替换空缺值、使用属性的中心度量填充空缺值、使用与给定元组属同一类的所有样本的平均值来填充空缺值、使用最可能的值填充空缺值答案正确
219、若一条记录中有多个属性值被遗漏了,则可将该记录排除在数据挖掘之外答案正确
220、噪声数据是指一个测量变量中的随机错误或偏差答案正确
13、商品数据一般包括()A、商品分类B、商品价格C、商品展示D、商品评价答案ABC
14、采集交易数据主要是为了通过数据分析评估客户价值,将潜在客户变为价值客户答案正确
15、评价数据主要以图片的形式出现答案错误
16、新闻网站有()A、腾讯网B、百度贴吧C、凤凰网D、博客答案AC
17、社交网站有()A、腾讯网B、百度贴吧C、凤凰网D、博客答案BD
18、商务数据可用于多种行业()A、制造业B、金融业C、个人娱乐D、餐饮行业答案ABCD
221、噪声数据也可以用于数据挖掘进行分析答案错误
222、孤立点的是不符合数据模型的数据答案正确
223、孤立点并不真实存在,是人们无意中弄出的偏差比较大的数据答案错误
224、处理噪声数据可以使用()方法A、分箱法B、回归法C、聚类D、忽略元组答案ABC
225、数据集成是指将互相关联的分布式异构数据源集成到一起,使用户能够以透明的方式访问这些数据源答案正确
226、数据集成的方法有()A、联邦数据库B、中间件集成C、数据仓库D、聚类答案ABC
227、数据仓库是数据集成最常用的方法答案正确
228、数据仓库来集成数据时需要处理的问题包括()A、实体识别B、冗余C、相关分析D、数据冲突和检测答案ABCD
229、实体识别,它所解决的问题是如何匹配多个信息源在现实世界中的实体事物答案正确
230、数据规约就是为了压缩数据量,帮助从原有庞大数据集中获得一个精简的数据集合,并使这一精简数据集保持原有数据集的完整性答案正确
231、数据规约的策略有()A、维归约B、数量归约C、数据压缩D、实体识别答案ABC
232、主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标答案正确
233、属性子集选择,主要用于检测并删除不相关、弱相关或冗余的属性目的是找出最小属性集,使得数据类的概率分布尽可能地接近使用所有属性得到的原分布答案正确
234、数量规约中有参数的方法一般使用()A、回归B、对数的线性模型C、直方图D、聚类答案AB
235、数量规约中无参数的方法一般使用()A、直方图B、聚类C、抽样D、数据立方体聚集答案ABCD
236、数据变换是将数据转换或统一成易于进行数据挖掘的数据存储形式,使得挖掘过程可能更有效答案正确
237、数据变换的方法有很多种,包括光滑、属性构造、聚集、数据规范化、数据离散化、概念分层等答案正确
238、数据规范化包括()A、最大-最小规范化B、零-均值规范化C、小数定标规范化D、数据离散化答案ABC
239、ETL全称为Extraction-Transformation-Loading中文名为数据抽取、转换和加载答案正确
240、安装kettle必须先安装jdk(java的运行环境)答案正确
241、安装jdk之后需要配置环境变量才能使用答案正确
242、ETL是Kettle的一种工具答案错误
243、()是转换里的基本组成部分它是一个图形化的组件,可以通过配置步骤的参数,使得它完成相应的功能A、步骤B、跳C、注释D、转换答案A
244、Kettle中的()定义了一个单向通道,允许数据从一个步骤向另一个步骤流动A、步骤B、跳C、注释D、转换答案B
245、csv、txt文件等都属于文本文件答案正确
246.Excel的数据可分为结构化的表格数据和非结构化的表格数据答案正确
247、Excel是一种()A、办公软件B、开发软件C、操作系统软件D、数据库答案A
248、Excel文件在kettle中可使用()步骤,进行excel的输入输出A、excel输入B、excel输出C、MicrosoftExcel输出D、MicrosoftExcel输入答案ABC
249、uMicrosoftExcel输出”步骤则可以设置Excel97文件或Excel2007版本的文件的输出答案正确
250、“Excel输出”步骤,仅能输出Excel97版本的文件答案正确
251、JSON(JavaScriptObjectNotationJS对象简谱)是一种轻量级的数据交换格式答案正确
252、JSON核心概念包括()A、数组B、对象C、属性D、路径答案ABC
253、JsonPath表达式通常是用来路径检索或设置Json的答案正确
254、JsonPath表达式有两种表示方法,分别是()A、点记法B、括号记法C、逗号记法D、操作符记法答案AB255XML指可扩展标记语言(ExtensibleMarkupLanguage)XML被设计用来传输和存储数据答案正确
256、XPath即为XML路径语言(XMLPathLanguage)它是一种用来确定XML文档中某部分位置的语言答案正确
257、数据库分为关系型数据库和非关系型数据库答案正确
258、MySQL数据的连接参数与Oracle的连接参数是完全相同的答案错误
259、连接名称是设定一个在作业或转换范围内唯一的名称答案正确
260、数据库连接步骤中在列表里可以选择可用的访问方式有()A、JDBC连接B、ODBC数据源C、JNDI数据源D、Oracle的0CI连接答案ABCD
261、数据库连接时,一般连接参数包括()A、主机名B、数据库名C、端口号D、用户名和密码答案ABCD
262、数据清理,就是试图检测和去除数据集中的噪声数据和无关数据,处理遗漏数据,去除空白数据域和知识背景下的白噪声,解决数据的一致性、唯一性问题,从而达到提高数据质量的目的答案正确
263、Kettle只能用单一的清洗步骤清洗工作,所以比较麻烦答案错误
264、常用的转换步骤一般在()A、转换目录B、脚本目录C、校验目录D、输出目录答案ABC
265、字符串做剪切的功能,该步骤需要在剪切字符串版面添加需要剪切的(A、字符串字段(输入流字段)B、输出字段(输出流字段)C、剪切的起始位置D、剪切的结束位置答案ABCD
266、字符串替换(Replaceinstring)步骤对字符串做查找替换答案正确
267、字符串操作功能包括()A、首尾去除空白字符B、大小写C、数字移除/提取D、删除特殊字符答案ABCD)
268、能使用正则表达式的是()A、字符串剪切B、字符串替换C、字符串操作D、以上都不行答案B
269、拆分字段成多行(Splitfiledtorows)可将一行记录拆分成多行记录,新的记录里有一个新的字段,由拆分后的子字符串填充答案正确
270、拆分字段SplitFields根据分隔符将输入的一个字段拆分成多个字段答案正确
271、合并字段ConcatFields将多个字段用分隔符连接起来输出到一个新的字段答案正确
272、字段选择Selectvalues可以对输入流的字段做选择、删除、重命名等操作,还可以更改字段的数据类型和精度等答案正确
273、字段选择Selectvalues有3个选项卡A、选择和修改B、移除C、元数据D、替换答案ABC
274、计算器步骤是一个函数集合来创建新的字段,还可以设置字段是否移除临时字段答案正确
275、流查询在查询前把数据都加载到内存中,并且只能进行等值查询答案正确
276、过滤记录让数据流从一路到两路答案正确
277、重复数据产生原因有A、录入出错B、数据不完整C、数据缩写D、硬件设备出错答案ABC
278、不完全重复数据,客观上表示现实世界中的同一实体,但由于表达方式不同或拼写错误等原因,导致数据存在了多条重复记录答案正确
279、“唯一行(哈希值)”步骤可以附加比较存储在内存中的记录值,防止哈希碰撞冲突答案正确
280、“唯一行(哈希值)”步骤必须先使用排序,不然无法去重答案错误
281、“去除重复记录”步骤要求输入的数据是事先排好序的,因为它是通过比较相邻记录的值来判断是否重复的答案正确
282、一个作业包括一个或多个作业项,这些作业项以某种顺序来执行答案正确
283、作业的组成包括()A、作业项B、作业跳C、注释D、输入答案ABC
284、作业项结果有两个作用,一是决定作业的执行路径,二是向下一个作业项传递一个结果对象答案正确
285、作业跳是作业项之间的连接线,定义了作业的执行路径答案正确
286、在Kettle里,作业是使用一种回溯算法来执行作业里所有作业项的答案正确
287、作业的执行结果是唯一的答案错误
288、作业中的变量代表一个任意长度的字符串值答案正确
289、变量的格式是${变量名}或者%%变量名%%答案正确290>读入studentcsv文件,输出以Tab分隔符分隔的studenttxt文件studentcsv文件以逗号为分隔符student.csv要求
1.运行流程图截图和运行结果文件内容截图或
2.书写分析执行步骤答案:解析:291>读入studentxlsx文件,输出分隔符为逗号的student.csv文件和命名为stuout.xlsx的文件studentxlsx要求
1.运行流程图截图、运行结果文件内容截图或
2.书写分析执行步骤292>读入“student.js”文件,输出“JsonToExcel.xlsx”文件和“student-out.js”的文件studentjs要求
1.运行流程图截图、运行结果文件内容截图或
2.书写分析执行步骤
19、商务数据可以监控竞争对手的动态答案正确
20、商务数据不同帮助企业和个人共享客户信息答案错误
21、商务数据的来源包括()A、电子商务平台B、社交平台C、020数据D、个人数据答案ABC
22、B2B是企业对企业之间通过互联网进行产品、服务及信息的交换答案正确
23、B2C是个人对企业开展的电子商务活动答案错误
24、下列常用的B2C平台有()A、阿里巴巴B、京东C、唯品会D、亚马逊答案BCD
25、常见的C2C平台有()A、阿里巴巴B、咸鱼C、淘宝D、eBay答案BCD
26、社交电商指基于社交关系、利用互联网社交媒介实现电子商务中的流量获取、商品推广和交易等其中一个或多个环节,产生间接或直接交易行为的在线经营活动答案:
293、读入°stringOP.xlsx0文件输出标准格式MstringOPOut..xlsxM文件klringOp.xlsx原文IDCODECITY0100755200233021a/AB110[CODE0010_「r075542roras3r021—6BJ-BeUingSZ-ShenZhenCQ-CHONGQINGSH-shanghaiCDCITY1SHEN^CNCHONGQINGSHANGHAI答案:
294、将个人信息.xlsx表中数据Gender字段改为Sex统一数据为F、M•并去除重狂数据持用一个人信息.xlsx要求
1.运行流程图截图、运行结果文件内容截图或
2.书写分析执行步骤答案:
295、先从Excel谈取数据保存到Excel再从文本文件中读取数据保存到Excel如果产生错误就发送假件,并且停止作业,如果成功发送成功邮件.文本文件输入.ixtExcel输入.xlsx要求1运行流程图截图、运行结果文件内容截图答案正确
27、抖音属于社交内容电商答案正确
28、社交分享电商主要包括()A、拼多多B、微信C、蘑菇街D、微博答案ABD
29、020电商模式是线上(Online)引流线下(Offline)消费模式答案正确
30、020数据主要有020电商平台数据和展销平台组成答案正确
31、数据采集又称数据获取,是利用设备或技术手段从现实环境及网络获取数据并放入系统内部进行使用答案正确
32、大多数互联网页编写都是用HTML语言答案正确
33、电子商务数据主要归类为()A、文本B、图片C、视频D、音频答案ABC
34、配置一种采集任务可以采集多个数据源答案错误
35、防采集措施有()A、封IPB、验证码识别C、登录D、不允许打开网页答案ABC
36、常见的采集方法包括web爬虫采集和API接口采集答案正确
37、Web爬虫主要分为通用网络爬虫和聚焦网络爬虫答案正确
38、通用网络爬虫基本工作流程包含()A、打开浏览器B、抓取网页C、数据存储D、预处理答案BCD
39、调用网站自身提供的应用程序编程接口,可以实现网络数据采集答案正确
40、数据的存储方式有()A、ExcelB、CSVC、数据库D、Python答案ABC
41、数据采集工具分为编程类和可视化采集工具两类答案正确
42、数据采集工具可以针对某个主题从微博爬取相关信息答案正确
43、数据采集工具不能爬取学术信息答案错误
44、常见的爬虫语言有()A、HTMLB、PythonCJavaD、PHP答案BCD
45、Python是一款服务器端解释性开源非编译脚本语言答案正确
46、数据采集器是进行数据采集的机器或者工具答案正确
47、数据采集器建立的任务也称之为规则答案正确
48、数据采集器采集不同字段时,建立一种规则就可以了答案错误
49、数据采集器不能采集以下哪种数据()A、图片B、文字C、网站信息D、专利答案D
50、哪种不是数据采集器A、Python爬虫B、八爪鱼采集器C、火车头采集器D、后羿采集器答案A
51、简易采集模式是利用系统内置模板进行数据采集的模式答案正确
52、简易采集可根据不同的参数进行不同程度的自定义采集答案正确
53、简易采集模板所有用户都可以使用答案错误
54、单页采集只能采集列表数据答案错误
55、表格数据采集要先选中表格中的一行数据答案正确
56、单网页采集主要是采集一个网页中的数据答案正确
57、列表详情页数据采集比单网页数据采集复杂答案正确
58、列表详情页需要从每个商品的标题进入到商品的详情页答案正确
59、采集列表详情页数据不需要循环步骤答案错误
60、单个网页上有很多相同链接,点击链接后进入再进行详情页数据采集,答案详情页*
961、当配置好任务,进行数据采集是,即用自己的本地电脑进行数据采集答案启动本地采集*
962、如果想使用云服务集群进行采集,可以选择答案启动云采集
963、数据导出可以导出的文件类型为()A、ExcelcsvHTMLD、MySql数据表答案ABCD
64、文本循环是通过输入关键字采集跟关键字相关的数据答案正确
65、URL循环是通过使用多个URL地址进行数据采集答案正确
66、循环采集包括()A、URL循环B、文本循环C、单个元素循环D、随机循环答案ABC
67、采集京东商品详情页数据,字段可任意要求叙述采集步骤或使用采集器采集数据截图答案解析
68、分页循环采集是指把一页数据分成多页进行采集答案错误
69、网址中有多个页面需要采集叫分页循环采集答案正确
70、点击页面上的“下一页”按钮翻页,是最常见的翻页方式答案正确
71、需要登录时就不能进行采集答案错误。