还剩10页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
南开大学23春学期高起专
1903、专升本1903《大数据开发技术二》在线作业Spark中运行交互式SQL查询的大规模并行查询引擎是选项A SparkCore选项B SparkSQL选项C BlinkDB选项D Mllib参考答案CSparkGraphX中类Graph的groupEdges方法可以选项A反转图中所有边的方向选项B按照设定条件取出子图选项C取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性选项D合并边相同的属性参考答案DGraphX中方法可以查询顶点信息选项A numVertices选项B numEdges选项C vertices选项D edges参考答案C以下哪个方法可以从外部存储中创建RDD选项A parallelize选项B makeRDD选项C textFile选项D loadFile参考答案CRDD的cartesian函数是笛卡尔积,也就是将两个集合的元素两两组合成一组选项A对选项B错参考答案AMLlib中StandardScaler处理的对象是每一列,也就是每一维特征将特征标准化为单位标准差或是0均值,或是0均值单位标准差选项A对选项B错参考答案AScala中高阶函数可以使用函数作为参数,也可以使用函数作为输出结果选项A对选项B错参考答案ASpark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗选项A对选项B错参考答案BRDD中zip操作要求两个RDD的partition数量以及元素数量都相同选项A对选项B错参考答案ASparkStreniing中DSlream代表着一系列的持续的RDDs选项A对选项B错参考答案ARDD的行动操作通过某种函数将一个RDD转换为一个新的RDD但是转换操作是懒操作,不会立刻执行计算选项A对选项B错参考答案BRDD是一个可读写的数据结构选项A对选项B错参考答案BScala中默认情况下使用的是可变的Map选项A对选项B错参考答案BRDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除选项A对选项B错参考答案AScala中高阶函数经常将只需要执行多次的函数定义为匿名函数作为参数选项A对选项B错参考答案BRDD中join操作根据键对两个RDD进行内连接,将两个RDD中键相同的数据的值相加选项A对选项B错参考答案B一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是HadoopMapReduce运行速度的()多倍选项A2选项B10选项C100选项D1000参考答案CSparkStreming中()函数可以使用func将源DStrcam中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream选项A union选项B reduce选项C join选项D cogroup参考答案BScala函数组合器可以把一个二维的列表展开成一个一维的列表的方法是()选项A filter选项B flatten选项C grouby选项D flatmap参考答案BDstream窗口操作中()方法基于滑动窗口对(KV)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的Dstream选项A window选项B countByWindow选项C reduceByWindow选项D reduceByKeyAndWindow参考答案D请问RDD的操作把RDD所有元素转换成数组并返回到Driver端选项A join选项B zip选项C combineByKey选项D collect参考答案DGraphX中VertexRDD[VD]继承自选项A EdgeRDD选项B RDD[Edge]选项C VertexRDDEVD]选项D RDD[VertexIdVD]参考答案DGraphX中方法可以缓存整个图,并指定存储级别选项A cache选项B presist选项C unpersistVertices选项D edgesunpersist参考答案BGraph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用方法选项A GraphverticesedgesdefaultVertexAttr选项B GraphfromEdgesRDD[Edge[ED]]defaultValue选项C Graph.fromEdgeTuplesrawEdges RDD[VertexldVertexld]defaultValue选项D GraphLoader.edgeListFilescfilename参考答案BGraphX中graphtriplets可以得到选项A顶点视图选项B边视图选项C顶点与边的三元组整体视图选项D有向图参考答案CMLlib中可以调用mllib.tree.DocisionTree类中的静态方法训练分类树选项A trainClassifier选项B trainRegressor选项C LogisticRegressionModel选项D LabeledPoint参考答案APairRDD中函数可以对具有相同键的值进行分组选项A mapValues选项B groupBy选项C groupByKey选项D reduceByKey参考答案C请问RDD的操作是将两个RDD组合成Key/Value形式的RDD选项A join选项B zip选项C combineByKey选项D collect参考答案Bspark-submit配置项中表示executor使用的总核数选项A--num-executorsNUM选项B--executor-memoryMEM选项C一total-executor-coresNUM选项D--executor-couresNUM参考答案Cspark-submit配置项中表示每个executor使用的内核数选项A--num-executorsNUM选项B--executor-memoryMEM选项C一total-executor-coresNUM选项D一executor-couresNUM参考答案DScala中方法返回Map所有的value选项A key选项B keys选项C value选项D values参考答案Dvara=10;whilea20{a+=l;}共循环了O次选项A9选项B10选项C11选项D12参考答案B图结构中如果任意两个顶点之间都存在有向边,那么称之为选项A完全图选项B有向完全图选项C无向图选项D简单图参考答案BScala中方法返回一个列表,包含除了第一个元素之外的其他元素选项A head选项B init选项C tail选项D last参考答案CGraph类中如果要直接通过边数据文件创建图,要求数据按空格分隔,应该用O方法选项A GraphverticesedgesdefaultVertexAttr选项B Graph.fromEdgesRDD[Edge[ED]]defaultValue选项C Graph.fromEdgeTuplesrawEdges RDD[VertexldVertexld]defaultValue选项D GraphLoader.edgeListFilescfilename参考答案DPairRDD可以通过获得仅包含值的RDD选项A key选项B keys选项C value选项D values参考答案D以下哪个不是Scala的数据类型()选项A AnyRcf选项B Anything选项C NULL选项D Nothing参考答案BScala中构造列表的两个基本单位是()选项A Nil选项B Nill选项C选项D List参考答案ACScala支持()选项A匿名函数选项B高阶函数选项C函数嵌套选项D柯里化参考答案ABCDPairRDD中()函数可以进行分组选项A mapValues选项B groupBy选项C groupByKey选项D reduceByKey参考答案BCRDD是一个()的数据结构选项A可读写选项B只读的选项C容错的选项D可进行并行操作的参考答案BCDSparkDataFramo中方法可以获取所有数据选项A collect选项B take选项C takeAsList选项D collectAsList参考答案ADSparkDataFrame中方法可以获取若干行数据选项A first选项B head选项C take选项D collect参考答案ABCDMLBase包括选项A Mllib选项B MLI选项C SparkR选项D GraphX参考答案ABMLlib中用于线性回归算法的包主要有选项A LinearRegressionWithSGD选项B RidgeRegressionWithSGD选项C LassoWithSGD选项D LeftRegression参考答案ABCSpark支持的文件格式包括选项A文本文件选项B JSON选项C CSV选项D SequenceFile参考答案ABCD以下哪个方法可以实现SparkSQL对数据的查询选项A SqlContext选项B MySQLContext选项C HiveContext选项D context参考答案ACScala语言中提供的数组是用来存储动态大小的同类型元素选项A对选项B错参考答案BScalaSet集合是没有重复的对象集合,所有的元素都是唯一的选项A对选项B错参考答案AScala中Map合并时会移除重复的key选项A对选项B错参考答案A。