pg下载 一文搞懂卷积神经网络(CNN)的原理(超详细)
取得了巨大成功的深度学习模型,是卷积神经网络,也就是Convolutional Neural Network,简称为CNN,其在计算机视觉领域。它们的设计灵感源自生物学里的视觉系统,目的在于模拟人类视觉处理的方式。在过去几年中,CNN于图像识别、目标检测、图像生成以及许多其他领域,都取得了显著进展,进而成为计算机视觉和深度学习研究的重要构成部分。
一、图像原理
在了解卷积神经网络前,我们先来看看图像的原理:
计算机里的图像,是由一堆数字构成的,且这些数字是按顺序排列的,其数值范围是从0到255 ,其中,0代表着最暗的程度,而数值255则表示最亮的程度啊。就如同下面所展示的这般情况:

所示的上面那张图,是那种仅仅只有黑与白这两种颜色呈现的灰度图,然而更为普遍运用的图片表达方式,乃是RGB颜色模型,也就是红色、绿色、蓝色这三种原色的色光,凭借不同样子的比例相互相加,进而产生出各种各样的色光,在RGB颜色模型里头,单个矩阵就扩展成为了按照顺序排列的三个矩阵,也能够运用三维张量来予以理解。
当中的每一个阵矩又被称作此图片的一个通道,由宽来描述,由高来描述,由深来描述。

二、为什么要学习卷积神经网络?
在传统神经网络里,当我们要去识别下图红色框中的图像之时,我们极有可能识别不出来,因为这六张图的位置均不相同,计算机没有办法分辨出它们实际上是同一种形状或者物体。

传统神经网络原理如下图:

我们期望,一个物体,无论处于画面左侧,还是右侧,皆会被识别作同一物体,此一特性便是不变性。为达成平移不变性,卷积神经网络等深度学习模型,于卷积层里,运用了卷积操作,该操作能够捕捉到图像里的局部特征,且不受其位置的干扰。

三、什么是卷积?
在卷积神经网络里头,存在着一种操作,它被叫做卷积操作,啥是卷积操作呢,就是把一个能够移动的小窗口,这个小窗口被称作数据窗口,就像下面图里的绿色矩形那样,和图像进行逐元素相乘,乘完之后再相加,这就是卷积操作。而这个小窗口实质上是一组固定的权重,它能够被视作是一个特定的滤波器,也就是filter,或者卷积核。这个操作之所以叫“卷积”,是源于这种元素级相乘和求和的过程形成的后果。这一操作是卷积神经网络名称得以存在的源头。

图片里的这个呈绿色的、体积不大的窗,它就是数据窗口的呈现呀。简单来讲呢,卷积操作其实就是借助一个本身可以移动的、大小较小的窗口,以此来从图像当中提取出相应的特征,这个小窗口之中包含着一整套特定的权重,凭借对这些已提取对象和图像里不同位置开展卷积操作,网络就能够进行学习而且捕捉到那些不同特征所涵盖的有关方面的信息。仅仅依靠文字进行具体解释的话,很有可能会让人觉得特别难以理解,那么接下来就直接向大家展示动图:

在那张图里,蓝色的框所指的是,一个属于数据方面的窗口,红色的框其作用是作为卷积核,也就是滤波器,最终所得到的绿色方形,它是卷积之后的结果,这种结果是通过数据窗口中的数据,与卷积核进行逐个元素相乘,然后再进行求和而得出来的句号。

一张图带你了解卷积计算过程
卷积需要注意哪些问题?
a.步长stride:每次滑动的位置步长。
它指卷积核数量,这数决定输出的深度厚度,并且它本身就相当于卷积核个数。
c. 填充值zero - padding:在其外围边缘增添若干圈0,借此方便从初始位置按照步长为单位能够恰好滑倒末尾位置,简单来说也就是为了让总长可以被步长整除。
以上图为例,那么:
数据窗口,每次进行移动,移动的幅度是两个步长,去获取 3*3 的局部数据,也就是 stride 等于 2。
• 两个神经元,即 depth=2pg下载麻将胡了安卓专属特惠.安卓应用版本.中国,意味着有两个滤波器。
• zero-padding=1 。
为什么要进行数据填充:
假设有一个大小为 4x4 的输入图像:
现在,我们需应用一个3x3的卷积核来进行卷积操作pg下载赏金下载,其步幅为1,并且要采用填充为1的方式。要是不使用填充,卷积核的中心就没办法对齐到输入图像的边缘,进而致使输出特征图尺寸变小。设定我们运用步幅为1来进行卷积,那么在不使用填充的情形下,输出特征图的尺寸会是2x2。
因此,我们需于它的周遭填充一整圈 0,将其填充成 1 所表达的意思实则是在输入图像的四周添置一整圈零数值,经由添加填充之后所形成的图像是这样的。
0, 0, 0, 0, 0, 0
0, 1, 2, 3, 4, 0
0, 5, 6, 7, 8, 0
0, 9, 10, 11, 12, 0
0, 13, 14, 15, 16, 0
0, 0, 0, 0, 0, 0
此时,针对这个已填充的输入图像,我们把 3x3 的卷积核予以应用,紧接着进行卷积结果的计算,最终获取到大小保持不变的特征图。
主要目的在于数据填充,是要确保卷积核可以覆盖输入图像的边缘区域,与此同时还要保持输出特征图的大小,这对在CNN里保留空间信息以及有效处理图像边缘信息而言无比重要。
卷积神经网络的模型是什么样的?

可以理解为框起来的上面那部分是一个滤波器,也就是带着权重被固定了的一组神经元,多个滤波器一叠加就成了卷积层。
四、卷积神经网络的构造

1 输入层
原始图像数据,由输入层来予以接收。图像一般是由三个颜色通道构成,这三个呀亦即红、绿、蓝,进而形成一个二维矩阵,这个二维矩阵呢用来表意像素的强度值,是这样的。
2 卷积和激活
卷积层对输入图像跟卷积核开展卷积操作pg下载官方认证,接着,借助应用激活函数(像ReLU)去引入非线性,这一步让网络得以学习复杂的特征。
3 池化层
池化层借助减小特征图的尺寸,以此达成减少计算复杂性的目的,它是经由选取池化窗口内的最大值或者平均值来予以实现的,这般做有助于提取最为重要的特征。
4 多层堆叠
CNN常常是由多个卷积层以及池化层相互堆叠构建而成,目的在于逐步地去提取更为高级别的特征,深层次的特征能够展现出更为复杂的模式。
5 全连接和输出
最终,全连接层会把提取出来的特征映射转变为网络的最终输出,而这输出能够是一个分类标签、回归值或者其他任务的结果。
形象的过程如下图:
展开形式

未展开形式

五、图片经过卷积后的样子
与人眼观看事物原理相似,卷积神经网络可以看到事物的轮廓
