还剩2页未读,继续阅读
文本内容:
第二章习题
一、选择题.在计算机内部,数据的表示形式是(C)A)八进制B)十进制C)二进制D)十六进制.以下哪种信号是模拟信号(A)调频立体声信号电报信号计算机输出的信号从光盘读取的信号研究某超市销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的那类问题(A)A)关联规则发现C)分类B)聚类D)自然语言处理将原始数据进行集成、变换、维度规约、数值规约是以下哪个步骤的任务(C)
二、填空题.数据采集的常用方法、、、.标注好数据集用于人工智能算法训练时,一般分为.有参的特征值归约的两种方法是、o.数据预处理主要包括、、.处理数据缺失值时常采用、方法
三、简答题.简述什么是预处理?.简述标注数据的用途?.简述常用的数据可视化工具有哪些第3章习题
一、选择题.在Windows操作系统中,当双击myfile.docx文件时下面说法正确的是(C)A)直接在notepad下打开myfile.docx文件B)直接在记事本下打开myfile.docx文件C)直接在Word下打开myfile.docx文件D)弹出选择打开方式对话框.下面哪个是常见的数据标注结果文件后缀名(B)A).MOVB).XMLC).AVID)JPG.CSV文件是以什么标点符号为分隔符的?(A)A)逗号B)句号C)单引号D)双引号.下面哪种说法是错误的(D)A)文本文件是基于字符编码方式存储文件B)二进制文件是按二进制的编码方式来存放文件的C)数据是以二进制编码方式存储在计算机文件中的D)计算机只能识别文本文件.FLV格式是哪一类文件的常见后缀名?(B)A)语音文件B)视频文件C)文本文件D)图像文件.下面对数据标注描述哪一个是正确的?(D)A)所有的数据标注都可以使用脚本语言自动标注B)可以通过算法来实现数据的自动标注C)OCR手写转录完全可以通过识别工具实现自动转录D)数据标注是个重复性很强的工作.下面对CSV文档叙述不正确的是(C)A)每条记录占一行B)字段中包含有逗号,该字段必须用双引号括起来C)以逗号或空格为分隔符D)字段中如果有双引号,该字段必须用双引号括起来.下面对JSON文档叙述不正确的是(B)Object是一个无序的“名称/值对集合一个对象以开始,结束C)每个“名称”后跟一个“”(冒号)D)“名称/值对”之间使用分隔
9.下面哪个标注工具的结果文件同时支持CSV、XML、JSON三个格式(C)A)VIAB)LabelboxLabelHUBD)Labelme
10.一段时长为1分钟,分辨率为640x480的录像(30帧/分,真彩色),未经压缩的数据量是字节(D)A)
15.4GB)154MC)
1.54MD)
1.54G
二、填空题.数据是以的形式存储在计算机中(文件).通常数据标注的类型包括、、、四种类型(文本标注、语音标注、图像标注、视频标注).NLP是英文NaturalLanguageProcessing的缩写,字面意思是(自然语言处理).数据标注就是按照客户的执行规范把各种各样的原始数据进行标注,是个很强的工作(重复性).JSON(JavaScriptObjectNotation)采用完全独立于语言的文本格式,是一种理想的数据语言(交换)
三、简答题.简述XML文件的语法规则.简述JSON文件的组成
3.谈一下你对自动标注的认识第四章答案
一、选择题1-5ACDDD6-10CABDA
二、填空题
1、包含初级资格所有内容,并有半年以上相关从业经历
2、图像标注
3、数据质检人员对于完成数据进行100%质检
4、成熟型
5、分发
三、简答题
1、参考答案一个合格的标注员需要具备以下素质持续的学习力、细心、耐心、责任心、较强的专注力、团队协作、良好的沟通表达能力等
2、参考答案遇到规则不明确的时候,标注员不能根据自己的理解进行标注,而应该反馈给项目负责人,集中开会解决,待明确标注规则后再进行标注
3、参考答案对数据标注进行管理,可以使标注流程更为规范化,降低错误率和返工率目前标注行业处于新兴行业,在初期需要建立一套规范化流程体系,对整个行业的发展都有促进作用主要有以下的几个作用1)规则化管理有利于企业效率的提升2)制度化管理有利于人才的培养3)规范化管理有助于数据的保密。