还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
南开大学23春学期(高起专
1903、专升本1903)《大数据导论》在线作业.第一个提出大数据概念的公司是()o选项A麦肯锡公司选项B谷歌公司选项C微软公司选项D脸谱公司参考答案A2下列哪个工具常用来开发移动友好地交互地图0选项A Leaflet选项B Visually选项C BPizzaPieCharts选项D Gephi参考答案A3下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()选项A ggplot2选项B network选项C ggmaps选项D animation参考答案D.MapReduce中的Map和Reduce函数使用()进行输入输出选项A key/value对选项B随机数值选项C其他计算结果参考答案A.医疗健康数据的基本情况不包括以下哪项?.FP是一种最有影响的挖掘布尔关联规则频繁项集的算法选项A对选项B错参考答案B.内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求选项A对选项B错参考答案A.在现有大数据的存储中,结构化数据仅有20%其余80%则在存在于物联网、电子商务、社交网络等领域的半结构化数据和非结构化数据选项A对选项B错参考答案A.利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医生的诊疗有迹可循,还可以发现最有效的临床路径从而及时为医生提供最佳的诊疗建议选项A对选项B错参考答案A.基于大数据的智慧医疗系统的建立,能显著的提高医疗机构的信息化水平,为医院、患者带去更多的利益选项A对选项B错参考答案A.数据仓库中的元数据分为技术元数据和业务元数据选项A对选项B错参考答案A.数据流要表现出流数据的特征,反映的是系统中流动的数据;选项A对选项B错参考答案B.云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作共同对外提供数据存储和业务访问功能的一个系统选项A对选项B错参考答案A选项A诊疗数据选项B个人健康管理数据选项C公共安全数据选项D健康档案数据参考答案C
6.购物篮问题是##的典型案例选项A数据变换选项B关联规则挖掘选项C数据分类参考答案B7下面哪一项不是中国发展大数据产业的基础选项A信息化积累了丰富的数据资源选项B大数据技术创新取得明显突破选项C大数据应用推动势头良好选项D大数据产业支撑薄弱参考答案D.数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段选项A运营式系统阶段选项B用户原创内容阶段选项C感知式系统阶段参考答案A.SAN是一种选项A存储设备选项B专为数据存储而设计构建的网络选项C光纤交换机选项D HBA参考答案B.数据仓库是随着时间变化的,下列不正确的是选项A数据仓库随时间变化不断增加新内容选项B捕捉到的新数据会覆盖原来的快照选项C数据仓库随事件变化不断删去旧的数据内容选项D数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合参考答案C.大数据的特点不包含选项A数据体量大选项B价值密度高选项C处理速度快选项D数据不统一参考答案D.以下哪项不是数据可视化工具的特性选项A实时性选项B简单操作选项C更丰富的展现选项D仅需一种数据支持方式即可参考答案D.GFS中的文件切分成的块进行存储选项A32MB选项B64MB选项C128MB选项D1G参考答案B.是MicrosoftOffice的核心组件选项A SQL选项B WORD选项C PPT选项D EXCEL参考答案D.DAS代表的意思是0选项A两个异步存储选项B数据归档软件选项C连接一个可选的存储选项D直连存储参考答案D.互连网上出现的海量信息可以划分为三种,分别为选项A结构化信息选项B非结构化信息选项C半结构化信息选项D特殊化信息参考答案ABC.常见的非结构化数据有选项A web网页选项B即时消息选项C富文本文档选项D实时多媒体数据参考答案ABCD.大数据时代预测人类移动行为的数据来源有选项A志愿者定位数据选项B装有导航设备的出租车轨迹数据选项C手机终端定位于通讯记录选项D社会网络签到数据参考答案ABCD.云计算是######的发展?,是虚拟化、效用计算、laaS(基础设施即服务)、PaaS(平台即服务)、Saas(软件即服务)等概念混合演进并跃升的结果选项A流计算选项B分布式计算选项C并行计算选项D网络计算参考答案BCD.数据变换(DataTransformation)的方法有()选项A光滑选项B聚集选项C数据泛化选项D规范化参考答案:ABCD.最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等选项A用户行为数据选项B日志式的活动数据选项C事件信息参考答案ABC.大数据存储的特点与挑战有()选项A容量问题选项B延迟问题选项C安全问题选项D成本问题参考答案ABCD.可使用######进行光滑选项A:最大值选项B箱中位数选项C箱边界选项D箱均值参考答案:BCD.数据工厂包括选项A低能耗数据中心选项B超大规模讲分布式架构选项C新一代智能自动化运维选项D超强云安全参考答案ABCD.基于大数据的临床决策支持系统的架构包括选项A支撑层选项B大数据分析层选项C网络层选项D应用层参考答案ABD.一个HDFS集群由一个##和阴构成此外,还有与这两个角色之间作为沟通桥梁的客户端Client选项A一个名字节点选项B若干个名字节点选项C一个数据节点选项D若干个数据节点参考答案AD.数据处理的两种方法是####选项A批处理选项B流处理选项C单个处理选项D交叉处理参考答案AB.按照数据量的大小,可将数据分析分为0选项A内存级数据分析选项B B1级数据分析选项C海量级数据分析选项D巨量级数据分析参考答案ABC.百度大脑包括()选项A:深度学习选项B超大规模机器学习选项C大规模GPU并行化平台参考答案:ABC.常见的分类方法有选项A决策树选项B贝叶斯网络选项C遗传算法选项D FP算法参考答案ABC.城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好的规划和动态调整选项A对选项B错参考答案A.交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集选项A对选项B错参考答案A.箱式图用于描述数据的分散情况,主要数据节点包括均值、中值、等中心值的度量,标准偏差、方差等可变性度量选项A对选项B错参考答案A.数据集成DataIntegration是将多个数据源中的数据合并存放到一个一致的数据存储中,数据源可以包含多个数据库、数据立方体或一般文件选项A对选项B错参考答案A.交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记录和监视设备的视频图像技术记录选项A对选项B错参考答案A.事件是Flume的基本数据单位选项A对选项B错参考答案A.数据获取方式分为主动式获取和被动式获取选项A对选项B错参考答案A.大数据的挑战仅仅来自于数据的增长选项A对选项B错参考答案B.不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态选项A对选项B错参考答案A.宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确支持“互联网+”医疗、“互联网+”健康选项A对选项B错参考答案A.Humanmobility即“人类移动性”,表示人类个体或群体在地理空间中具有特定意义的“移动Movement”所隐含的社会系统要素时空分布与演化规律选项A对选项B错参考答案A.内存分析数据量比BI分析数据量大选项A对选项B错参考答案B。