2023深度学习基础知识题库大全.docx
《2023深度学习基础知识题库大全.docx》由会员分享,可在线阅读,更多相关《2023深度学习基础知识题库大全.docx(30页珍藏版)》请在优知文库上搜索。
1、2023深度学习基础知识题库大全1.梯度下降算法的正确步骤是什么?a.计算预测值和真实值之间的误差b.重复迭代,直至得到网络权重的最佳值C,把输入传入网络,得到输出值d.用随机值初始化权重和偏差e.对每一产生误差的神经元,调整相应的(权重)值以减小误差A.abcdeB.edcbaC.cbaedD.dcaeb解析:正确答案D,考查知识点-深度学习。2、已知:- 大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。- 每一个神经元都有输入、处理函数和输出。- 神经元组合起来形成了网络,可以拟合任何函数。- 为了得到最佳的神经网络,我们用梯度下降方法不断更新模型给定上述关于神经网络
2、的描述,什么情况下神经网络模型被称为深度学习模型?A.加入更多层,使神经网络的深度增加B.有维度更高的数据C.当这是一个图形识别的问题时D.以上都不正确解析:正确答案A,更多层意味着网络更深。没有严格的定义多少层的模型才叫深度模型,目前如果有超过2层的隐层,那么也可以及叫做深度模型。3、训练CNN时,可以对输入进行旋转、平移、缩放(增强数据)等预处理提高模型泛化能力。这么说是对,还是不对?A.对B.不对解析:对。如寒sir所说,训练CNN时,可以进行这些操作。当然也不一定是必须的,只是dataaugmentation扩充数据后,模型有更多数据训练,泛化能力可能会变强。4、下面哪项操作能实现跟神
3、经网络中Dropout的类似效果?A.BoostingB.BaggingC.StackingD.Mapping解析:正确答案BoDropout可以认为是一种极端的Bagging,每一个模型都在单独的数据上训练,同时,通过和其他模型对应参数的共享,从而实现模型参数的高度正则化。5、下列哪一项在神经网络中引入了非线性?A随机梯度下降B,修正线性单元(ReLU)C.卷积函数D.以上都不正确解析:正确答案Bo修正线性单元是非线性的激活函数。6 .深度学习是当前很热门的机器学习算法,在深度学习中,涉及到大量的矩阵相乘,现在需要计算三个稠密矩阵AzBzC的乘积ABC,假设三个矩阵的尺寸分别为m*n,n*p
4、,p*q,且mnpq,以下计算顺序效率最高的是()As(AB)CB、AC(B)C、A(BC)D、所以效率都相同正确答案是:A首先,根据简单的矩阵知识,因为A*B,A的列数必须和B的行数相等。因此,可以排除B选项,然后,再看A、C选项。在A选项中,m*n的矩阵A和n*p的矩阵B的乘积,得到m*p的矩阵A*B,而A*B的每个元素需要n次乘法和n-1次加法,忽略加法,共需要m*n*p次乘法运算。同样情况分析A*B之后再乘以C时的情况,共需要m*p*q次乘法运算。因此,A选项(AB)C需要的乘法次数是m*n*p+m*p*q。同理分析,C选项A(BC)需要的乘法次数是n*p*q+m*n*q07 .输入图
5、片大小为200200,依次经过一层卷积(kernelsize55,padding1,stride2)zpooling(kernelsize33zpadding0,stride1),又一层卷积(kernelsize33,padding1,stride1)之后,输出特征图大小为A、95B、96U97D、98正确答案是:C首先我们应该知道卷积或者池化后大小的计算公式,其中,padding指的是向外扩展的边缘大小,而stride则是步长,即每次移动的长度。这样一来就容易多了,首先长宽一般大,所以我们只需要计算一个维度即可,这样,经过第一次卷积后的大小为:本题(200-5+2*1)/21为99.5,取9
6、9;经过第一次池化后的大小为:(99-3)/1+197;经过第二次卷积后的大小为:(97-3+2*1)/1+1为978 .神经网络模型(NeuralNetwork)因受人类大脑的启发而得名神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,对输入进行处理后给出一个输出,如下图所示。请问下列关于神经元的描述中,哪一项是正确的?A、每个神经元可以有一个输入和一个输出B、每个神经元可以有多个输入和一个输出C、每个神经元可以有一个输入和多个输出D、每个神经元可以有多个输入和多个输出E、上述都正确正确答案是:E答案:(E)每个神经元可以有一个或多个输入,和一个或多个输出。9 .如果我们用了
7、一个过大的学习速率会发生什么?A、神经网络会收敛B、不好说C、都不对D、神经网络不会收敛正确答案是:D学习率过大,会使得迭代时,越过最低点。10 .在一个神经网络中,下面哪种方法可以用来处理过拟合?A、DropoutB、分批归一化(BatChNormalization)C、正则化(regularization)D、都可以正确答案是:D解析:都可以。对于选项Cz分批归一化处理过拟合的原理,是因为同一个数据在不同批中被归一化后的值会有差别,相当于做了dataaugmentatioo11 .批规范化(BatChNOrmaliZation)的好处都有啥?A、让每一层的输入的范围都大致固定B、它将权重的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 深度 学习 基础知识 题库 大全
