还剩12页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
人工智能基础复习题含参考答案
1、在“小米的创始人是谁”这个问题中,关系词是A、谁B、小米C、创始人答案C
2、以下哪个任务通常不可以通过词向量实现A、单词相似性计算B、文本相似性计算C、词语类比D、中文分词答案D
3、利用下游任务的有标注数据,对GPT模型进行精调时,通常使用模型中的哪一层来完成预测任务A、第1层B、第2层C、中间层D、最后一层答案D
4、在神经网络中,通过反向传播计算得到的梯度来更新网络的参数,达到训练的目的,从而降低目标函数的值A、优化器B、损失函数C、激活函数D、迭代次数答案A
5、BERT主要使用了什么模型作为基本结构A、RNNLSTMTransformerD、GRU答案C
6、OpenAI提出的GPT主要使用了什么模型作为基本结构A、RNNLSTMD、深度卷积特征答案ABCD
52、以下属于问答系统的主要模块的是A、信息抽取B、问句分析C、查询构建D、短语映射答案BCD
53、以下哪项任务属于OCR范畴A、车牌识别B、身份证信息识别C、手写汉字识别D、文本翻译答案ABC
54、以下关于句法分析的说法正确的是A、句法是研究句子的每个组成部分和它们之间的组合方式B、句法分析就是指对句子中的词语语法功能进行分析C、在自然语言或者计算机语言中,句法分析是利用形式化的文法规则对一个符号串进行分析的过程D、一般来说,句法和语言是无关的答案ABC
55、LSTM由一个单元模块由哪些门组成?A、输入们B、遗忘门C、更新门D、输出们答案BCD
56、出现过拟合的情况时,模型可能过于简单了,没有很好地学习到数据中的规律A、正确B、错误答案B
57、计算机视觉的任务是用图像创建或恢复现实世界模型,然后认知现实世界A、正确B、错误答案A
58、二值图像的每个像素只有两种取值
0、2550表示白色,255表示黑色A、正确B、错误答案B
59、版面恢复的主要内容是识别原文档的排版,按原排版格式将识别结果输出到文本文档A、正确B、错误答案A
60、为了在预测过程中得到确切的结果,我们通常对训练样本只进行数据增强,而在预测过程中不使用带随机操作的数据增强A、正确B、错误答案A
61、TF-IDF能够找出文档中出现频率最高的词A、正确B、错误答案B
62、Transformer里没有用到注意力机制A、正确B、错误答案B
63、相比于LSTM双向GRU有利于获取上下文信息,使用多层结构有利于获取高级语义A、正确B、错误答案B
64、在机器学习中,聚类任务属于监督学习A、正确B、错误答案B
65、VGG-11使用可复用的卷积块构造网络不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义A、正确B、错误答案A
66、RolPooling收集输入的featuremaps和proposals综合这些信息后提取proposalfeaturemaps送入后续全连接层判定目标类别A、正确B、错误答案A
67、卷积神经网络中边界填充padding的作用是增加提取的特征个数A、正确B、错误答案B
68、后续研究表明,BERT最初提出的预训练方式中,下一个句子预测任务是非常重要,对模型性能有重要作用,不可取代的A、正确B、错误答案B
69、OCR识别的关键路径在于文字检测和文本识别部分,这也是深度学习技术可以充分发挥功效的地方A、正确B、错误答案A
70、NLP是人类和机器之间沟通的桥梁A、正确B、错误答案A
71、可以使用BERT中的Sequenceclassification实现文本情感分类任务A、正确B、错误答案A
72、现代NLP算法都是基于机器学习,尤其是统计机器学习A、正确B、错误答案A
73、在基于词典的中文分词中,词典中的字符串就是词A、正确B、错误答案A
74、对于文本分类来说,使用余弦相似度来计算KNN中的相似度比使用欧式距离更合适A、正确B、错误答案A
75、CRNN算法是基于Sequence2Sequence的文本识别算法A、正确B、错误答案BCTransformerD、GRU答案c
7、以下关于端到端的问答系统说法错误的是A、可以通过基于深度学习的方法来实现B、无需人工编写大量模板C、中间的过程类似于黑盒操作D、中间的过程类似于白盒操作答案D
8、常见的CBOW词向量模型有几层神经网络组成A、1B、2C、3D、4答案C
9、以下哪个函数能实现将深度神经网络的输出分布标准化,且加和为1sigmoidsoftmaxreluDadam答案B
10、通过残差块构建跨层的数据通道,是计算机视觉中最流行的体系架构A、VGGAlexNetResNetDDenseNet答案c
11、是指模型的描述能力太弱,以至于不能很好地学习到数据中的规律A、模型退化B、欠拟合C、过拟合D、梯度爆炸答案B
12、以下哪项属于OCR技术落地难点A、文字弯曲B、实时处理C、背景干扰D、尺度过小答案B
13、首次将Attention引入文本识别领域的算法为A、SAR算法B、R2AM算法C、NRTR算法D、MaskTextSpotter算法答案B
14、自然语言处理包括语言识别、语音合成和A、语言翻译B、语言理解C、语言交流D、语言训练答案B
15、有关图像融合评价指标的说法中,不正确的是A、一般可以从主客观结合的角度进行评价B、以燧为标准的评价指标都是越大越好C、不存在标准的一套量化指标用于评估图像质量D、可以从信息论角度入手进行图像质量评估答案B
16、OpenAI提出的GPT全称是什么答案A
17、以下哪个任务不属于词法分析A、中文分词B、词性标注C、命名实体识别D、文本分类答案D
18、下列算法中减少了常用词的权重,增加了文档集合中不常用词的权重的是A、词频B、逆文档频率C、Word2VecD、隐狄利克雷分布答案B
19、什么是机器翻译A、将一门人类语言转换成另一门人类语言B、将人类语言转换成机器语言C、将任意一门人类语言转换成英语D、将机器语言转换成人类语言答案A
20、可以从新闻文本数据中分析出名词短语,动词短语,主语的技术是?A、词性标注B、依存分析和句法分析C、N-Gram抽取D、词袋模型答案B
21、以下关于问答系统与对话系统的说法错误的是A、问答系统是一种特殊的对话系统B、问答系统是一种特殊的任务型对话系统C、问答系统是一种特殊的闲聊式对话系统D、问答系统通常在一次对话中完成用户的信息获取需求答案C
22、下列不属于RoiPooling作用的是?A、减少regionproposalsB、统——regionproposals的形状C、加快模型的处理速度D、实现端到端训练答案A
23、在BERT开展掩码语言模型预训练过程中,会对15%的输入文本进行mask其中不属于常规mask的操作是哪一个A、替换为mask]标记B、替换为词表中的任意一个随机词C、保持原词不变D、删除原词答案D
24、哪一个组件在CTPN与通用FasterRCNN中完全一致A、CNN特征提取模块B、RPN模块C、双向LSTMD、分类器答案A
25、LSTM的输入态不包含哪个?A、t-1时刻的细胞状态CB、t-l时刻隐层状态hC、t-l时刻输入向量xD、t时刻输入向量x答案C
26、一个基础的transformer模型的输入是什么A、词向量B、编码器C、解码器D、神经元答案A
27、以下哪个不是目标跟踪技术研究的主要难点?A、目标外观形变B、背景嘈杂C、目标尺寸太大D、目标被部分遮挡答案C
28、Transformer中通过什么方式引入单词顺序信息A、词向量B、位置编码C、自注意力机制softmax答案B
29、自然语言处理是用技术的一种应用A、语音识别B、虚拟现实C、人工智能D、自然语言答案D
30、以下哪个模型不是BERT模型的改进版本RoBERTaMacBERTBiLSTMDistilBERT答案c
31、属于知识检索常用手段的有A、基于查询语言的知识检索B、基于语义的知识检索C、基于模板的知识检索D、语义搜索答案ABD
32、对于任意两个相邻的proposals Bj和Bi需要满足哪些条件才能连接?A、Bj在水平距离上离Bi最近B、它们的水平重叠verticaloverlap
0.7C、该距离小于50pixelsD、它们的垂直重叠verticaloverlap
0.7答案:ACD
33、以下说法正确的是A、目标跟踪的目的是在第一帧给定感兴趣目标的状态位置和大小,在视频的后续帧中自动地预测该目标状态B、图像风格转换技术只能处理单张图像C、行为识别任务是要求识别出数据中人或动物等的行为D、视频目标分割技术能与图像风格转换技术结合起来,如对图像背景进行某种艺术风格转换,对前景进行另外一种不同的艺术风格转换答案ACD
34、在进行问句分析时,以下属于实体词的是A、名字B、地点C、何时D、时间答案ACD
35、深度学习OCR主要分为以下哪几步?A、文本行检测B、字符分割C、单字符识别D、行文本识别答案AD
36、在KBQA中,构建查询语句的方法有A、基于语义解析的方法B、基于机器学习的方法C、基于模板的方法D、基于问句分析的方法答案:ABCD
37、批量归一化层可以作用在oA、全连接层和卷积层输出上,激活函数前B、全连接层和卷积层输出上,激活函数后C、全连接层和卷积层输入上D、随时都可以答案AC
38、下列哪些网络属于循环神经网络RNNA、门控循环单元GRUB、卷积神经网络CNNC、Transformer网络D、长短期记忆网络LSTM答案AD
39、可以用来进行词性标注的工具有A、LTPjiebaHanLPD、CRF答案ABC
40、以下属于问句分析任务需要做的是A、识别问题类型词B、识别实体词C、识别中心词D、构建查询语句答案ABC
41、人工评估机器翻译的结果具有以下哪些缺点?A、具有主观偏差性B、成本昂贵C、效率低D、不能反映语义信息答案ABC
42、根据使用的方法划分,以下哪些可用于文本情感分析A、基于情感词典B、基于机器学习C、基于深度学习D、基于凸优化答案ABC
43、关于视频目标分割以下说法正确的是?A、目标分割技术的目的是将感兴趣的目标分割出来B、视频目标分割毫无研究价值C、视频目标分割的输出是二进制的前景背景分割空间D、视频目标分割技术只能在视频的每一帧图像中分割出一个目标出来答案AC
44、传统OCR方法首先检测出文本行,然后利用以下哪种对文本行中的单个字符进行字符分割A、连通域算法B、垂直投影算法C、MSER算法D、BM3D算法答案AB
45、以下哪些场景可以用到情感分析技术?A、关系抽取B、情感对话C、产品分析D、舆情监控答案BCD
46、以下哪项是图像二值化的全域值方法?A、自适应阈值法B、固定阈值法C、NiBlack算法D、Otus算法答案BD
47、半监督学习方法中,以下说法正确的有A、半监督学习方法班阔基于种子的启发式方法和远程监督方法B、基于种子的启发式方法对初始种子的质量要求高,总体准确率较高C、远程监督方法存在错误传递问题,影响分类器的效果D、基于种子的启发式方法构建成本低,适合大规模的数据构建,并且可能发现新的隐含关系答案ACD
48、下列哪项不属于复杂类问题?A、刘德华和周润发谁的年龄更大?B、腾讯是什么性质的企业?C、周杰伦是魔羯座吗?D、拼多多有多少名员工?答案BCD
49、以下哪些模型属于循环神经网络A、RNNB、LSTMC、GRUD、CNN答案ABC
50、如何衡量OCR的好坏A、拒识率B、误识率C、识别速度D、产品稳定性答案ABCD
51、以下哪些特征提取技术常用于目标跟踪技术中提取样本特征?A、灰度特征B、图像梯度直方图特征HOGC、颜色名特征CN。