还剩17页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据复习题+答案ict
1、用户将证书上传到弹性负载均衡中,在创建()协议监听的时候绑定证书,提供HTTPS或TCP服务、HTTPSAB、HTTPC、TCPD、UDP答案A
2、HDFS集群跟目录下存在一个文件text.txt,下列()命令可以查到此文件A、hdfs fsck/test.txt-files所存储的DatNode节点信息B、hdfs fsck/text.txt-locationsC^hdfs fsck/test.txt-blocksD、hdfs fsck/test.txt-list-corruptfileblocks答案B
3、剪枝是决策树学习算法对付
(一)的主要手段A、欠拟合B、计算速度C、过拟合D、计算效率答案C
4、下面()不是属性选择度量A.ID3使用的信息增益B、NNM使用的梯度下降C、C
4.5使用的增益率D、CART使用的基尼指数答案B
5、某公司要建立资料库,该资料库要用ElasticSearch进行检索,请问下列哪些选项可以放到资料库中?、Word文档AB、公司宣传视频C、产品设计图D、以上全部正确答案D
6、Flume的高级组件不包含以下哪个?A、FilesSystemB、FSDatalnputStreamC、FSDataoutputstreamD、FileConfiguration答案A
50、在配置微服务灰度发布的“发布任务”时,必须要配置的参数不包括、微服务引擎AB、微服务应用名C、发布环境D、任务名称答案B
51、Kafka中数据从Producer到Broker和Broker到Consumer分别是那种传递方式A、pullpushB、pullpullC、pushpushD、pushpull答案D
52、以下不属于CN自动剔除约束的是、设置CN心跳超时时间的值大于0AB、集群中的CN总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后,逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行答案D
53、数据仓库仅仅是提供存储的,提供一种的服务,不面向最终分析用户而数据集市是的,面向最终用户A、面向分析应用、面向数据管理B、面向分析应用、面向事务交互C、面向数据管理、面向分析应用D、面向事务交互、面向数据管理答案C
54、哪种负载均衡模式不支持按域名和URL转发能力?A、都一样B、经典型c、独享型D、共享型答案B
55、现在有一亿条数据要插入Hbase,使用下列哪种方式最好?A、shell端put命令B、put方法C、bulkload方法D、insert方法答案C
56、在Hadoop生态系统中,()建立在MapReduce之上,主要用来弥补MapReduce编程的复杂性A、HBaseB、Flumec、PigD^Sqoop答案c
57、Streaming主要通过zookeeper提供以下的()实现事件侦听、分布式锁机制AC、CheckpointC、ACKD、Watcher答案D
58、(—)的目的就是给定学习器选择最有利于其性能的特征子集A、嵌入式选择B、稀疏表不C、包裹式选择D、过滤式选择答案C
59、Fusioninsight HD中,如果需要查看当前登录HBase的用户和权限组,可以在HBase shell中执行()命令A、userpermissionB、whoamiC、whoD、get_user答案B
60、大数据最显著的特征是()A、数据处理速度快B、数据类型多样C、数据价值密度高D、数据规模大答案D
61、创建API时,需要填写()信息A、API名称B、API目录C、请求PathD、请求方法答案ABCD
62、Flink的兼容性体现在()方面A、YARN能够作为Fl ink集群的资源调度管理器B、能够与Hadoop原有的Mappers和Reduces混合使用C、能够使用Hadoop的格式化输入和输出D、能够从本地获取数据答案ABCD
63、裸金属服务器支持挂载()类型的磁盘A、nfsB、本地硬盘、对象存储CD、云硬盘答案:BD64Fusioninsight HD中,在使用Streaming的ACK机制时,说法正确的是()、启用了Acker之后,Streaming会识别发送失败的Tuple并自动重发,无A需人为干预B、Acker会标识处理超时或者处理失败的消息为faiLC、从spout开始,形成的Tuple树中任何一个环节失败都会标记整棵树失败D、应用需要在spout的fail接口方法中实现消息重发逻辑答案BCD
65、常见的图像分割算法有
(一)A、基于阈值的分割方法B、基于人工勾画的分割方法C、基于边缘的分割方法D、基于区域的分割方法答案ACD
66、调整角色包含()、变更角色AB、新增角色C、角色不同主机之间迁移D、删除角色答案BCD
67、关于Hbase存储模型的描述正确的是()A、即使是:key值相同,qualifier也相同的多个KeyValue也可能有:多个,此时使用时间戳来区分B、同一个key值可以关联多个valueC、keyvalue中期有时间戳,类型等关键信息D、每一个keyvalue都有一个qualifier标识答案ABCD
68、关于Kafka的Peoducer,如下说法正确的是()A、可以同时起多个Producer进程向同一个Topic进行数据发送B、Producer是:消息生产者C、Producer生产数据时需要先连接ZooKeeper,而后才连接BrokerD、Producer生产数据需要指定Topic答案ABD
69、Hbase中以下()场景会触发Flush操作A、Hbase定期刷新MetaStore,默认周期为1小时B、当WALs中文件数量达到阈值C、Region中MetaStore的总大小达到了预设的Flush Size阈值D、MetaStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小答案ABCD
70、以下()属于HCS
8.0私有云平台网卡虚拟化技术A、TAPB、TUNC、VETPD、ETH答案ABC
71、在Service0M界面上可以完成()配置工作A、安全B、网络资源C、存储资源D、计算资源答案ABCD
72、非结构化数据的管理常采用
(一)、NewSQLAB、关系云C、NoSQLD、mysql答案ABC
73、下列说法错误的是
(一)0A、数值和数据是不同的概念,数值在信道上传输之后,转换为信号形式的数据B、信息是与材料、能源一个层次的概念,不属于客观存在C、特征编码是将非数值型特征转换成数值型特征的方法D、聚类算法要求数据集无量纲化答案AB
74、Service0M可以查看()参数A、物理主机vCPUB、主机的CPU复用比C、物理主机vCPU使用率D、物理主机内存使用率答案ACD
75、分布式缓存服务(Redis)通过()存储数据A、KEYB、IDC、ValueD、主键答案AC
76、在ManageOne创建VDC关键性步骤有()A、基本参数B、资源配置C、配额设置D、区域设置答案AC
77、SparkSQL使用场景丰富,可以处理的数据源包括?A、文本文件HiveC、JsonD、RDD答案ABCD
78、下面关于Fusioninsight LibrA权限授予的描述正确的有()、权限授予最小化,只需要SELECT权限的不需要授予其他权限AB、不要为了方便随便授予ALL PRIVILEGES权限C、谨慎授予可能改变表内容的操作(update insert)权限D、管理好权限周期,超过时间及时使用REVOKE回收权限答案ABCD
79、向用户授权DRS权限流程包括()A、创建用户组并授权B、创建用户C、用户登录并验证权限D、用户自行添加权限答案ABC
80、大数据计算框架Spark中除了RDD还有哪些数据类型?A、DataTypeB、DataFrameC、DataSetD、DataSchema答案BC
81、数据字典能修改的内容包括()A、数据字典的类型B、数据字典名称C、数据字典类型的子项D、数据字典的层级答案AC
82、云资源监控通过()、技术中台和AI数据中台服务实时查看数据中心云资源的性能详情A、计算资源B、存储资源C、网络资源D、数据库资源答案ABCD
83、以下关于数据服务说法错误的是()A、数据服务采用Serverless架构B、支持弹性扩展C、数据服务的功能包括API生成、API注册、API调用和API运营D、数据服务api接口发布成功后,可以实现在线修改答案ABC
84、采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用()ChannelA、memory ChannelB、JDBC ChannelC、File ChannelD、HDFS Channel答案BC
85、在HBase表设计中,对于多项业务公用rowkey,导致数据访问矛盾的情况,可以有()应对策略、折中法(rowkey设计兼顾A和B的业务需求)AB、冗余法(用空间换时间厂效率)C、创建二级索引D、预分region答案ABC
86、以下选项对GraphBase概念描述正确的是?A、Vertex:节点/顶点,用于表示现实世界中的实体对象B、VertexLabel:节点的标签,用于表示现实世界中的实体类型C、Edge Label:边的标签,用于表示现实世界中的关系类型D、Edge:边,用于表示关系度答案ABC
87、在DRS的标签管理服务中,下列存在的功能有()A、添加标签B、编辑标签C、备份标签D、删除标签答案ABD
88、SeviceStage与0服务有集成关系、容器镜像服务SWRAB、虚拟私有云VPCC、云容器引擎CCED、弹性云服务器CSE答案ABCD
89、许多功能更为强大的非线性模型可在线性模型基础上通过引入
(一)和()而得、降维AB、高维映射C、层级结构D、分类答案BC
90、当ICAgent无法采集资源的指标时资源状态为通道静默,可能的原因是()、ICAgent问题AB、资源被删除或被停止C、主机本地时间与NTP服务器时间不同步D、A0M不支持监控当前资源类型答案ABCD
91、Structuredstreaming可以将过去的输入流缓冲为流状态,以便将每个未来输入与过去的输入相匹配,从而生成流连接结果、正确AB、错误答案A
92、离线批处理,通常是指对海量数据进分析和处理,形成结果数据,供下一步数据应用使用,离线处速对处理时间要求不高A、正确B、错误答案A
93、在Spark中,累加器可以实现高速并行的计数器和变量求和;在Spark的应用程序开发过程中,只有在Driver上获取此计数器的值、正确AB、错误答案A
94、Fusioninsight Manager界面上,当收到Kafka磁盘容量不足告警,且该告警的原因排除硬件故障时,系统管理员需要考虑扩容解决此问题A、正确B、错误答案A
95、Flink是Apache社区孵化的项目A、正确B、错误答案A
96、实时检查询只能查询结构化数据、正确AB、错误答案B
97、在噪声数据中,波动数据比离群点数据偏离整体水平更大A、正确B、错误答案B
98、GraphBase创建索引必须在创建schema之后,创建点边之前,否则数据查询不到、正确AB、错误答案A
99、一个弹性公网IP只能绑定一个云资源使用,且弹性公网IP和云资源必须在同一个区域、正确AB、错误答案B100s FusioninsightHD中,使用Streaming的Linux命令行模式提交拓扑时,需要先使用一个拥有Streaming提交权限的用户进行kinit方式认证A、正确B、错误答案AA、ChannelSelectorsourceselectorB SourceInterceptorC、ChannelInterceptorD、SinkProcessor答案B、大数据技木的4V特征不包含以下哪项7A、VirtualB VolumeC、VarietyD、Velocity答案A
8、关于容器镜像的描述,以下说法错误的是?A、Build Once,Run AnywhereB、无需下载到本地即可快速运行C、提供了一种全新的软件格式,使得软件的分发变得容易D、分层的特件使软件能够被快速打包,且占用空间大大减少答案C
9、以下()选项不属于数据中台三层架构A、轻度汇总层B、分析层C、共享层D、贴源层答案A
10、存储过程的调用有几种方式()、3AB、1C、2D、4答案B
11、()的告警为历史告警A、过去时间紧急告警B、已确认已清除C、过去时间重要告警D、过去时间次重要告警答案B
12、Flink中的()接口属于流数据处理,()接口用于批处理A、DataBatch API,DataStream APIB、Stream API,Batch APICDataStream API,DataSet APID、Batch API,Stream API答案c
13、执行以下哪个命令,可以验证文件系统域名是否可以解析到IP地址A、pingB、wgetC、nslookupD scp答案c
14、下列属于日常监控的功能是0A、弹性ipB、大屏监控C、仓U建ELB月艮务D、用户使用日志监控答案B
15、每个弹性伸缩组同一时刻支持使用()个伸缩配置A、1B、3C、7D、5答案A
16、Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是()OA、SinkB、ChannelC、Channel SelectorD、Interceptor答案D
17、信息增益
(一),意味着使用属性进行划分所获得的纯度提升A、越小B、越大C、无法确定D、不变答案B
18、某企业运维人员反馈最近经常遭受无规律的攻击,企业管理员希望站点在遭受攻击后,系统会触发预定义的安全策略,从而实现自动防护以下哪种类型的安全云服务可以满足企业的上述诉求?、堡垒机AB、漏洞扫描服务C、企业主机安全D、安全态势感知答案D
19、在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是X:lines,filter….groupByKey…Y:lines.groupByKey....filter…A、X比Y的性能更高B、X比Y的性能更低C、X和Y和性能一样D、无法确性X和的性能差异Y答案A
20、以下关于ElasticSearch介绍错误的是?A、EaNode:Elasticsearch节点,一个节点就是一个Elasticsearch实例B、Document:文档,被索引的基本单位C、EsMaster:主节点D、Index:索引,与关系型数据库中的索引概念一样答案D
21、C
4.5决策树算法中采用一对连续属性进行离散化处理A、二分法B、最小二乘法C、均值法D、投票法答案A
22、大数据应用开发流不包以下哪项?、可行性分析AB、应用推广C、技术选型D、需求分析答案B
23、以下关于StreamExecution持实查询过程的描项哪项是正确的?A、获取最新数据offsetsoffsets写入offsetLog优化LogicaLPLam构造LogicalPlan计算结果sink计算完成commitB、获取最新数据offsetsoffsets写入offsetLog构造LogicalPlan优化LogicaLPLam计算完成commit计算结果sinkC、offsets写入offsetLog获取最新数据offsets构造LogicalPlan优化LogicaLPLam计算结果sink计算完成commitD、获取最新数据offsetsoffsets写入offsetLog构造LogicalPlan优化LogicaLPLam计算结果sink计算完成commit答案D
24、负载均衡服务IP错误的是A、可以自动分配服务IPB、可以手动分配服务IPC、服务IP是ELB地址信息D、不是必须的答案D
25、CLOG日志缓冲区使用()算法A、FIFOB、LRUC、SLRUD、RANDOM答案c
26、当一个MapReduce应用程序被执行时,如下()动作是map阶段之前发生的A、sortB、combineC、partitionD split答案D
27、Spark是用以下()编程语言实现的A、JAVAB、C++c、cD、Scala答案D
28、下列关于物理交换机和虚拟交换机区别的描述,不正确的是A、虚拟交换机的正常运行同样需要一定的硬件资源B、虚拟交换机运行在物理服务器上,物理交换机有单独的硬件C、虚拟交换机无法配置三层接口,物理交换机可以配置三层接口D、虚拟交换机无法对VLAN标签做操作,物理交换机可以对VLAN标签做操作答案D
29、keepalived的配置文件中使用什么表示从服务器?A、MAINB、SLAVEC、MASTERD、BACKUP答案D
30、Spark自带的资源管理框架是()A、YARNB、DockerC、Stand aloneD、Mesos答案D
31、数据质量支持从完整性、()、及时性、一致性、准确性、唯一性六个维度进行单列、跨列、跨行和跨表的分析自定义质量规则时,请对此规则进行维度匹配A、交叉性B、时效性C、共享性D、有效性答案D
32、关于RDD,下列说法错误的是()A、RDD具有血统机制LineageB、RDD默认存储在磁盘C、RDD是一个只读的,可分区的分布式数据集D、RDD是Spark对基础数据的抽象答案B
33、下列对图数据库描述正确的是?A、与关系型数据库类似的数据库B、以“图”数据结构存储和查询数据的数据库C、数据仓库的一种D、存储图片的数据库答案B
34、Dashboard提供可视化图表和,帮助业务人员通过图形化界面轻松构建具有专业水准的可视化应用,实现实时数据可视化视屏墙,帮助业务人员快速发现、诊断业务问题A、全面的运维数据B、创建ECS服务C、仓U建ELB月艮务D、创建CCE服务答案A
35、DWS DN的高可用架构是A、王备从架构B、一主多备架构C、两者兼有D、其他答案A
36、微服务CSE提供的一系列能力中以下哪项是与微服务发现相关的A、注册中心B、配置中心C、治理中心D、服务监控答案A
37、如果弹性云服务器超过处于中间状态,则说明出现异常,需要联系管理员处理A、30分钟B、20分钟C、10分钟D、60分钟答案B
38、下列不属于CDM支持的文件增量迁移方式的是A、增量导出全部新增的文件B、增量导出指定大小的文件C、增量导出指定时间以后的文件D、增量导出指定目录的文件答案B
39、下面关于DNS的描述,不正确的是?A、在Internet上,域名和IP地址之间的对应关系可以是一对一,也可以多对一,无论哪种对应关系,DNS均可以进行解析B、域控制器会将它的主机名,IP地址和所扮演的角色等信息注册到DNS服务期内,以便其他计算机可以通过DNS服务器找到这台域控制器C、DNS反向解析需要建立反向查找区域,将IP地址解析成域名D、DNS提供了域名和IP地址之间转换的服务答案A
40、机器学习研究的主要内容是在计算机上从数据中产生
(一)的算法,即学习算法A、模型B、样本C、规律D、示例答案A
41、Flink中的DataStream数据流转不包含以下哪项?A、DatasinkB、TransfornationsC、ActionsD、Datasource答案C
42、DLI支持以下()字符码的数据A、UTF-8B、ASCIIC、GB2312D Base64答案A
43、国网数据中台,是在下面()数据中心阶段的基础上发展过来的、营销服务中心AB、海量历史/实时数据中心C、电网GIS数据中心D、全业务统一数据中心答案D
44、()将自动检查其后端云服务器的运行状况如果发现某台云服务器运行不正常,则会停止向该云服务器发送流量,并重新将流量发送至正常运行的云服务器A、后端接口B、前端接口C、负载均衡器D、监听器答案D
45、离线批处工具不包合以下哪项?、SQLAB、StormC、MapReduceD、Spark答案B
46、在支持向量机中,核函数的主要作用是
(一)oA、将低维空间中线性不可分的数据映射到高维空间,使其线性可分B、将高维空间中线性不可分的数据映射到低维空间,使其线性可分C、将高维空间中线性可分的数据映射到低维空间,使其线性不可分D、将低维空间中线性可分的数据映射到高维空间,使其线性不可分答案A
47、在一个3义3的图像区域内,如果中心像素值为5,它相邻的8个像素值的和为67,那么采用均值滤波后,中心像素的像素值为
(一)o、72AB、8C、9D、5答案B
48、Flume用于收集数据,其传输的数据基本单位是()A、SplitB、BlockC、EventD、Packet答案C
49、Configured实现了closeable接口,可以适用于多种文件系统。