科技知识干货!卷积神经网络深度与其性能之间的关系

VGG探索了卷积神经网络的深度与其性能之间的关系,成功地构筑了16~19层深的卷积神经网络,并且证明了增加网络的深度能够在一定程度上影响网络最终的性能,使错误率大幅下降,同时拓展性又很强,迁移到其他图片数据上的泛化性也非常好。

到目前为止,VGG仍然被广泛用来提取图像特征。VGG可以看成加深版本的AlexNet,二者都由卷积层、全连接层两大部分构成。VGG有如下特点。

(1)结构简洁。VGG由5层卷积层、3层全连接层、softmax输出层构成,层与层之间使用最大化池分开,所有隐层的激活单元都采用ReLU函数。

(2)小卷积核和多卷积子层。VGG有一个重要的特点,即它具有小卷积核。VGG没有采用AlexNet中比较大的卷积核尺寸,而是降低卷积核的大小(3×3)来模仿AlexNet的网络结构,增加卷积子层数也能够达到相同的目的。这样的改进可以减少参数,并且通过增加非线性映射的次数,提高网络的拟合或表达能力。

(3)小池化核。相比AlexNet的3×3的池化核,VGG全部采用2×2的池化核。

(4)通道数多。VGG网络第一层的通道数为64,后面每层都进行了翻倍,最多512个通道。通道数的增加,使得更多的信息可以被提取出来。

(5)层数更深、特征图更宽。由于卷积核专注于扩大通道数,池化专注于缩小宽和高,使得模型架构在更深、更宽的同时,控制了计算量的增加规模。

(6)全连接转卷积。这也是VGG的一个特点。在网络测试阶段,将训练阶段的3个全连接替换为3个卷积,使测试得到的全卷积网络因为没有全连接的限制,可以接收任意宽或高的输入,这在测试阶段是非常重要的。

如图所示,输入图像是224×224×3像素点,如果后面3个层都是全连接,那么在测试阶段就只能将测试的图像全部都缩放大小到224×224×3像素点,才能符合后面全连接层的输入数量要求,这样就不便于测试工作的开展。而“全连接转卷积”可以参考图进行替换。

好啦,这次的分享就到这里,我们下期再见!欢迎在评论区补充和留言。

主营产品:风机,净化空调