Update 第九章_图像分割.md

修整图片
This commit is contained in:
l0rraine 2021-01-29 11:12:41 +08:00 committed by GitHub
parent df306793fd
commit 590cfa1ece
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
1 changed files with 12 additions and 1 deletions

View File

@ -39,6 +39,7 @@
![](img/ch9/figure_9.1.1_2.jpg)
<center>图 4</center>
### 9.3.2 FCN网络结构
FCN对图像进行像素级的分类从而解决了语义级别的图像分割semantic segmentation问题。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类全联接层softmax输出不同FCN可以接受任意尺寸的输入图像采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。
@ -103,12 +104,15 @@
![](img/ch9/figure_9.1.7_1.png)
<center>一个分类网络</center>
![](img/ch9/figure_9.1.7_2.png)
<center>变为全卷积网络</center>
![](img/ch9/figure_9.1.7_3.png)
<center>End-to-end, pixels-to pixels网络</center>
![](img/ch9/figure_9.1.7_4.jpg)
@ -135,7 +139,9 @@ Upsampling的操作可以看成是反卷积(deconvolutional),卷积运算的
![](img/ch9/figure_9.1.8_1.png)
<center>上图中的反卷积input是2×2, output是4×4。 Zero padding, non-unit strides, transposed。</center>
![](img/ch9/figure_9.1.8_2.png)
<center>上图中的反卷积input feature map是3×3, 转化后是5×5, output是5×5</center>
### 9.2.8 跳级(skip)结构
@ -143,6 +149,7 @@ Upsampling的操作可以看成是反卷积(deconvolutional),卷积运算的
对CNN的结果做处理得到了dense prediction而作者在试验中发现得到的分割结果比较粗糙所以考虑加入更多前层的细节信息也就是把倒数第几层的输出和最后的输出做一个fusion实际上也就是加和
![](img/ch9/figure_9.1.9_1.png)
&emsp;&emsp;
实验表明这样的分割结果更细致更准确。在逐层fusion的过程中做到第三行再往下结果又会变差所以作者做到这里就停了。
@ -169,28 +176,32 @@ Upsampling的操作可以看成是反卷积(deconvolutional),卷积运算的
*对于不同尺寸的输入图像各层数据的尺寸heightwidth相应变化深度channel不变。*
![](img/ch9/figure_9.1.10_1.png)
&emsp;&emsp;
1全卷积层部分进行特征提取, 提取卷积层3个蓝色层的输出来作为预测21个类别的特征。
&emsp;&emsp;
&emsp;&emsp;&emsp;&emsp;
2图中虚线内是反卷积层的运算, 反卷积层3个橙色层可以把输入数据尺寸放大。和卷积层一样升采样的具体参数经过训练确定。
&emsp;&emsp;&emsp;&emsp;
1) 以经典的AlexNet分类网络为初始化。最后两级是全连接红色参数弃去不用。
![](img/ch9/figure_9.1.10_2.png)
&emsp;&emsp;&emsp;&emsp;
2) 从特征小图()预测分割小图(),之后直接升采样为大图。
![](img/ch9/figure_9.1.10_3.png)
<center>反卷积橙色的步长为32这个网络称为FCN-32s</center>
&emsp;&emsp;&emsp;&emsp;
3) 升采样分为两次完成橙色×2, 在第二次升采样前把第4个pooling层绿色的预测结果蓝色融合进来。使用跳级结构提升精确性。
![](img/ch9/figure_9.1.10_4.png)
<center>第二次反卷积步长为16这个网络称为FCN-16s</center>
&emsp;&emsp;&emsp;&emsp;
4) 升采样分为三次完成橙色×3, 进一步融合了第3个pooling层的预测结果。