From 3e21978862352b47bdb03673e439cb51f9bd3078 Mon Sep 17 00:00:00 2001 From: scutan90 <31844692+scutan90@users.noreply.github.com> Date: Wed, 31 Oct 2018 22:56:34 +0800 Subject: [PATCH] =?UTF-8?q?Update=20=E7=AC=AC=E4=B9=9D=E7=AB=A0=5F?= =?UTF-8?q?=E5=9B=BE=E5=83=8F=E5=88=86=E5=89=B2.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ch9_图像分割/第九章_图像分割.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ch9_图像分割/第九章_图像分割.md b/ch9_图像分割/第九章_图像分割.md index d208db1..6a48175 100644 --- a/ch9_图像分割/第九章_图像分割.md +++ b/ch9_图像分割/第九章_图像分割.md @@ -77,7 +77,7 @@ FCN对图像进行像素级的分类,从而解决了语义级别的图像分    (3)最后一个全连接层也做类似的,令其F=1,K=1000,最终输出为[1x1x1000]。 -**9.1.5 FCN的输入图片为什么可以是任意大小?** +**9.1.5 为什么传统CNN的输入图片为什么是固定大小?**    对于CNN,一幅输入图片在经过卷积和pooling层时,这些层是不关心图片大小的。比如对于一个卷积层,outputsize = (inputsize - kernelsize) / stride + 1,它并不关心inputsize多大,对于一个inputsize大小的输入feature map,滑窗卷积,输出outputsize大小的feature map即可。pooling层同理。但是在进入全连接层时,feature map(假设大小为n×n)要拉成一条向量,而向量中每个元素(共n×n个)作为一个结点都要与下一个层的所有结点(假设4096个)全连接,这里的权值个数是4096×n×n,而我们知道神经网络结构一旦确定,它的权值个数都是固定的,所以这个n不能变化,n是conv5的outputsize,所以层层向回看,每个outputsize都要固定,那每个inputsize都要固定,因此输入图片大小要固定。