pg下载官方认证 动画详解 CNN 卷积神经网络,每层数据流向清晰易懂

频道:生活应用 日期: 浏览:26

一种用于手写数字识别的神经网络模型,是由Yann LeCun等人在论文Gradiennt-Based Learning Applied to Document Recognition中提出的卷积神经网络,就是这样。

卷积在生活应用_CNN卷积神经网络搭建教程_LeNet-5卷积神经网络模型

在那篇论文里头,作者把基于卷积神经网络的模型称作LeNet - 5,LeNet - 5网络模型是首个成功运用到手抄数字识别项目里的,被视作卷积神经网络领域开创性工作当中的一项,该网络还是首个被广泛应用于计算机视觉领域的神经网络当中的一个,好多基于卷积神经网络的模型跟着也都被推出了。

CNN卷积神经网络搭建教程_LeNet-5卷积神经网络模型_卷积在生活应用

学习计算机视觉模型时,首要的那项任务便是要弄明白CNN卷积神经网络模型,原因在于好多计算机视觉模型都是以CNN卷积神经网络模型为基础来做进一步优化设计的,而CNN卷积神经网络模型是最基础的视觉模型,对于其中涉及到的参数、定义、数据流向等该如何搡弄具有一定难度,特别是CNN卷积的操作要怎样付诸实施,本期所介绍的这个工具,能够把CNN卷积的过程予以可视化,而且还能对整个CNN卷积神经网络模型开展搭建。

LeNet-5卷积神经网络模型_CNN卷积神经网络搭建教程_卷积在生活应用

搭建卷积神经网络,主要包含几个组件,有输入层,有卷积层pg下载官方认证,有激活函数层pg下载麻将胡了A.旗舰厅进体育.cc,有池化层,有全连接层,还有输出层。

在输入层,因为输入卷积神经网络模型的图片数据尺寸并非都相同,为了计算便利,输入图片数据会于输入层开展裁剪或者填充操作,以利于后续的卷积操作进行。此输入层是指输入到CNN卷积神经网络的图像。鉴于我们采用RGB图像作为输入,所以输入层存在三个通道,它们分别对应着红色、绿色以及蓝色通道,而对于灰色或者说黑白图片,因其只有一个通道,故而输入层仅有一个。

CNN卷积神经网络搭建教程_LeNet-5卷积神经网络模型_卷积在生活应用

卷积层,会依据所选卷积核,以及步长,从输入数据左上方起,直至右下方进行卷积运算。卷积层是CNN基础,因其含学习到的内核,即权重,这些内核能提取区分不同图像的特征。卷积神经元用卷积核与前一层相应神经元输出做元素点积运算。这会产生与卷积核数量同样多的中间结果。

卷积在生活应用_LeNet-5卷积神经网络模型_CNN卷积神经网络搭建教程

由于卷积核超出输入图时,一般来讲要做填充,填充能够保留输入图边界的数据,进而提升性能,还对保留输入的空间大小有益,这样能让网络架构更深、性能更高。在卷积神经网络中,填充的方式有不少,不过最常用的办法是零填充,这是因为它具备性能、简单性以及计算效率等优点。

内核大小,一般也叫过滤器大小,意即输入图片上滑动窗口的尺寸,选择此超参数对图像分类任务影响颇大,比如,小的内核大小可从输入里提取含高度局部特征的海量信息,较小的内核大小致使层尺寸减少得少,进而允许更深的架构,相反,较大的内核大小提取的信息少,这会让层尺寸减少得更快,通常会致使性能下降pg下载,大内核更适宜提取更大的特征。追根溯源,挑选适宜的内核大小会依赖于任务以及数据集,然而一般来讲,较小的内核大小能够给图像分类任务带去更优的性能。

LeNet-5卷积神经网络模型_卷积在生活应用_CNN卷积神经网络搭建教程

步长所表达的是,内核每一次应该移动的像素数量,步幅对于CNN的影响,类似于内核大小,随着步幅的减小,因为提取了更多数据,所以能够学习更多特征,这也会致使输出层更大,相反,随着步幅的增加,这会造成特征提取更加有限,输出层尺寸更小,借助在线可视化,可以挑选合适的输入矩阵以及padding,内核还有步长等参数,来进行可视化卷积操作。

卷积在生活应用_LeNet-5卷积神经网络模型_CNN卷积神经网络搭建教程

通过卷积操作所得到的特征图数据,一般而言,都会经历一次激活函数的操作,激活函数是用于获取输入特征的非线性信息的,而卷积神经网络模型当中,最为常见的激活函数是 ReLU。

CNN卷积神经网络搭建教程_卷积在生活应用_LeNet-5卷积神经网络模型

一般选择max pooling,随后,经过激活函数后的特征图,会添加一层池化层,以供进行下采样操作。

CNN卷积神经网络搭建教程_卷积在生活应用_LeNet-5卷积神经网络模型

在得到最终的输出特征图过后,会历经一层全连接层,将所有特征图予以连接,从而保证每个神经元都能够参与运算。这一层会把网络里的三维层转换成一维向量,以此来适应全连接层的输入以便进行分类。比如说,5x5x2张量会被转换为大小是50的向量。

卷积在生活应用_CNN卷积神经网络搭建教程_LeNet-5卷积神经网络模型

(6)全连接层输出的特征图维度所对应的,是会输出用于图片识别或者分类操作之举的分类维度。输出层,通常会使用呈现分类任务概率分布的Softmax操作。Softmax操作存在着一个关键目的,那便是确保CNN输出总和为1。所以,Softmax操作能够用于把模型输出缩放成概率。

CNN卷积神经网络搭建教程_LeNet-5卷积神经网络模型_卷积在生活应用

https://github.com/poloclub/cnn-explainer
https://poloclub.github.io/cnn-explainer/

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。