还剩4页未读,继续阅读
文本内容:
第三章
一、选择题
1.最早的神经元数学模型是A.BP模型B.感知器模型C.CNN模型D.M-P模型答案D解释最早的形式化神经元数学模型是M-P模型,由美国心理学家McCulloch和数理逻辑学家Pitts合作于1943年提出
2.生物神经元包括树突和轴突,其中树突相当于,轴突相当于A.输入端处理端B.输出端处理端C.输入端输出端D.输出端输入端答案A.下列哪个函数不可以做激活函数?y=tanhxy=sinxy=2xy=sigmiodx答案C解释激活函数的作用引入非线性值,并且映射所以y=2x不符合作为激活函数的要求.tanh激活函数通常比隐藏层单元的sigmoid激活函数效果更好,因为其输出的平均值更接近于零,因此它将数据集中在下一层是更好的选择,请问正确吗?A.TrueB.False答案:A
5.下面哪个选项不是神经网络训练过程中过拟合的防止方法?A.提前终止B.增加学习率C.L2正则化D.dropou答案B.卷积神经网络的正向传播过程是指从输入层到输出层的信息传播过程,该过程包括的操作有()A.卷积操作B.池化操作C.Relu操作D.全连接分类答案D.以下哪些结构属于BP神经网络A.输入层.隐含层C.输出层D.卷积层答案D
8.前馈神经网络通过误差后向传播(BP算法)进行参数学习,这是一种()机器学习手段A.监督学习.半监督学习C.无监督学习D.无监督学习和监督学习的结合答案A.下面对前馈神经网络描述不正确的是()A.层与层之间通过“全连接”进行连接,即两个相邻层之间神经元完全成对连接B.各个神经元接受前一级神经元的输入,并输出到下一级C.同一层内神经元之间存在全连接D.同一层内的神经元相互不连接答案C.下面对前馈神经网络这种深度学习方法描述不正确的是()A.实现了非线性映射B.是一种端到端学习的方法C.隐藏层数目大小对学习性能影响不大D.是一种监督学习的方法答案C
一、填空题
1、进行深度学习应用开发的第一步也是至关重要的一步就是数据处理
2、TensorFlow2提供了函数tf.keras.utils.getfile用于下载数据集
3、在实际开发过程中,开发人员都需要对数据进行分析通过分析,选取合适的数据以及相对应的数据预处理方法是项目开发成功的关键o
4、借助seaborn工具(安装命令pipinstallseaborn)可以对数据进行数据可视化
5、散点矩阵图可以用于粗略揭示数据中不同列之间的相关性
6、数据送入模型进行训练之前,一步很重要的步骤就是清洗无效数据
7、开发者想获取指定某连续几行的数据,如第30行到49行,可以通过切片的方式获取
8、pandas提供无效数据统计函数isnan
9、处理无效数据的方法有很多种,比如填充Nan数据、直接删除对应的数据
10、在机器学习领域,某种值的递增本身就有特殊的意义,建议采用序号唯一编码技术
11、把每一项数据视为一个长度为N的数组,数据类型有多少种,数组长度就为多少数组中每一个元素取值只有
0、1两种形式,并且每一个数组中只有一项是1这种编码技术是独热ont・hot编码
12、自然语言处理中的向量化先确定一个N项的数组每个数组元素值通常都是用浮点数据,能代表更多的分类
13、数据处理的最后一步就是数据集拆分部分数据集用于评估模型性能
14、通常在机器学习中将数据拆分为三份训练集TrainingDataset、验证集ValidationDataset测试集TestDataset
15、数据集拆分有二种常见的方法留出法和K・折交叉验证法
16、人工神经元ArtificialNeuron是构成神经网络的基本单元,其主要是模拟生物神经元的结构和特性,接收一组输入信号并产生
17.现代人工神经元模型由连接、求和节点和激活函数组成
18、邀适函数对人工神经网络有非常重要的意义,能够提升网络的非线性能力、环节模型训练期间梯度消失的问题、加速网络收敛等
19、Sigmoid函数可以使输出平滑而连续地限制在0-1在0的附近表现为近视线性函数而远离0的区域表现出非线性输入越小越接近于0;输入越大越接近于120Tanh函数继承自sigmoid函数,改进了sigmoid变化过于平缓的问题,它将输入平滑地限制在〜1-1的范围内
21、现代深度学习技术,模型训练一般采用梯度下降法来更新参数
22、损失函数用于描述网络模型的预测值和真实值之间的差距大小,是衡量神经网络学习质量的关键
23、模型评估是深度学习应用开发非常重要的一个环节直接影响该模型是否可以用于实际生产环境
24、为了更好的刻画训练过程,可以通过亘视化训练过程来帮助开发者更好的掌握模型训练的过程
25、为了解决过拟合现象,一般采用正则化技术
二、综合题加利福尼亚州人口普查,收录了20640条样本数据包含的属性有longitudejatitude/housing_median_agetotal__rooms/total_bedrooms/population/households家庭人数median_incomezmedian_house_value/ocean_proximityo本题要求使用加利福尼亚的房价数据,用第三方库Sklearn获取房价数据进行预测模型的搭建数据弓I入fromsklearn.datasetsimportfetch_california_housinghouse=fetch_california_housing任务要求L下载数据集,并打印出前10行数据2分析数据,读取数据获取数据维度
3.数据拆分、归一化处理4搭建模型,设置优化模型,损失函数、回调函数进行训练
5.测试测试集,获取结果测试第四章一选择题
1、关于MNIST下列说法错误的是(C)A.是著名的手写体数字识别数据集B.有训练集和测试集两部分C.训练集类似人学习中使用的各种考试试卷D.测试集大约包含10000个样本和标签
2、以下选项中,机器学习算法真正用来“学习”的数据是(B)A.验证集B.训练集C.测试集D.超参数集
3、对于神经网络的说法,下面正确的是()A增加神经网络层数可能会增加测试数据集的分类错误率B减少神经网络层数,总是能减小测试数据集的分类错误率C增加神经网络层数,总是能减小训练数据集的分类错误率4预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于(OoA、用于对模型的效果进行无偏的评估B、用于比较不同模型的预测准确度C、用于构造预测模型D、用于选择模型
5、什么样的数据不适合用深度学习()A、数据集太小B、数据集太大C、数据集没有局部相关性D、数据集局部相关性极强
6、学习没有标签的数据集的机器学习方法是?()A、监督学习B、无监督学习C、半监督学习D、强化学习
7、可以通过(C)数据处理手段实现去除图像冗余部分A.图像归一化B.均值C.白化D.图像灰度化
8、图像归一化的主要作用是AA.将图像按照一定的标准形式进行标准化处理,使图像能具有抵抗几何变换的能力B.去除图像噪声部分C.改正图像采集系统的系统误差和仪器位置的随机误差D.矩阵维数下降,运算速度大幅度提高,并且梯度信息仍然保留
9、在tensorflow开发环境下,可以使用A方法来完成图像灰度化的操作tensorflowimagergbtograyscaletf.image.rgb_to_hsvtf.image.rgb_to_yiqtf.image.rgb_to_yuv
10、One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效它主要是用来解决类别型数据的离散值问题的假定对篮球,足球,乒乓球,羽毛球进行独热编码,其中篮球的编码结果为A
[1000]
[0100]
[0010]
[0001]IKLabelEncoder编码对不连续的数字或者文本进行编号,将其转换成连续的数值型变量假定对[〃paris〃,“paristokyoamsterdanT]进行labelencoder编码,那么得到的结果应该是A
[1120]
[0012]
[1120]
[2201]
12、全连接神经网络简称是CCNNRNNDNNRCNN
13、全连接神经网络一般由B几部分组成A.输入层,池化层,输出层B.输入层,隐藏层,输出层C.输入层,输出层D.输入层,卷积层,输出层二填空题
1、MNIST是一个非常著名的手写数字数据集,由纽约大学教授YannLeCun负责构建
2、TensorFlow2也提供了自动下载MNIST数据集函数keras.datasets.m函st.loaddata
3、数宁图像本质就是一个建数组
4、TensorFlow2中的MNIST数据存储是以npz格式存储因此是无法再电脑用图片编辑器软件打开的
5、在MNIST数据集中返回训练集的形状为600002828的三维数组
6、全连接神经网络对单个数据要求输入数据为向量,而不是二维数组因此,需要将28x28的二维数组转换为一维数组
7、TensorFlow2中保存的MNIST原始数据的数据类型是uint8但是在后续的处理中肯定是会涉及到浮点数操作,因此需要将这些数据转换为浮点数
8、MNIST的标签编码方式是序列化唯一
9、MNIST数据集中图片的像素值是0-255范围内的,但是不同的图片的像素分布差别很大小像素值很容易在忽略的过程中被忽略掉,这对模型最终的性能影响是非常大的为了解决此类问题,可以通过对像素值的缩放来缓解常见的一种方法就是图像归一化即将所有像素的值缩放到上L范围内
10、手写数字识别是一个3层的全连接神经网络模型
11、分类任务的评估标准一般采用谨确率来进行评估
12、启动训练,程序会自动在脚本所在的目录下创建一个checkpoint文件夹所有的权重模型都保存在该文件夹下
13、通过加载指定权重实现在模型训练程序完全停止后进行模型测试或者在测试中间保存的某一个模型的性能
三、综合题Cifar-10数据集一个十分接近普适物体的彩色图像数据集,它一共包含10个类别的RGB彩色图片飞机(airplane)、汽车(automobile)、鸟类(bird)、猫(cat)、鹿(deer)、狗(dog)、蛙类(frog)、马(horse)、船(ship)和卡车(truck)其中每个图片的尺寸为32x32每个类别有6000个图像,数据集中一共有50000张训练图片和10000张测试图片在本章我们需要做的就是构建DNN网络模型,在cifar-10数据集上训练,得到一个比较好的识别cifar-10数据集的模型任务要求任务1cifar-10数据集任务2搭建并训练cifar-10识别模型任务3cifar-10识别模型性能验证。