VPR2017 实例分割 (RW比较有逻辑)
对比Instance-FCN,MNC,DWT等。
主题:在一个bounding box不准确的情况下。根据距离变换的掩码分割。
工作:采用多阶段映射,在截断情况下取得每个像素点和像素边界的最小距离,通过逆距离变换 [3, 18]将多值映射转换成mask。
设计一个对象掩码网络(OMN),首先取得pixel-wise的多值映射,然后解码成mask.
对截断距离离散。
然后得到很多映射,每个是每一个像素点的activation。接下来把这些映射传递到新的残差卷积网络。不限于bounding-box,且可微。
RW:
通用框架1:先检测,再分割。
方法1:对特定的类的对象检测。 [32, 16]
方法2:通用object proposal。 [1, 28]。分类在后面的部分。
[14]用Fast-RCNN box 构建多级流水线提取特征分类分割。
通过Hypercolumn特征[15],使用全卷积网络(FCN),来编码特定于类别的 shape priors[21],改进了该框架
[8]将Region Proposal Network集成到一个多任务网络casade(集联)用于分割。
但是,都有bounding box内部分割,的问题。我们用边界感知的OMN预测超出框外的片段,集成到MNC(多任务网络级联)框架中。
框架2:跳过检测部分。
[22]PFN,预测实例数目,每个像素的语义标签和边界框位置。
缺点:依赖预测实例数目的准确性。
[36]基于深度排序识别实例。
[35]Markov Random Field
缺点:列深相似情况。
[33]同时预测深度、语义、direction encoding,然后用模板匹配过程生成实例。
缺点:不能联合优化,次优问题。
[29]用RNN
缺点:认为看到的所有实例属于同一类。
框架3:class-agnostic region proposals[1,34,20](不知类,只区分前景和背景),依赖于深度架构[25, 26]
[6]:用FCN计算一小组instance-aware的score map,在MNC中有效。
我们的方法和这些方法有竞争力,甚至更好。此外我们将其集成到完整的实例分割网络中,得到state-of-art。