0%

Boundary-aware Instance Segmentation(cvpr2017)

VPR2017 实例分割 (RW比较有逻辑) 
对比Instance-FCN,MNC,DWT等。


主题:在一个bounding box不准确的情况下。根据距离变换的掩码分割。
工作:采用多阶段映射,在截断情况下取得每个像素点和像素边界的最小距离,通过逆距离变换 [3, 18]将多值映射转换成mask。
设计一个对象掩码网络(OMN),首先取得pixel-wise的多值映射,然后解码成mask.
对截断距离离散。
然后得到很多映射,每个是每一个像素点的activation。接下来把这些映射传递到新的残差卷积网络。不限于bounding-box,且可微。


RW:
通用框架1:先检测,再分割。
    方法1:对特定的类的对象检测。 [32, 16]
    方法2:通用object proposal。 [1, 28]。分类在后面的部分。
        [14]用Fast-RCNN box 构建多级流水线提取特征分类分割。
        通过Hypercolumn特征[15],使用全卷积网络(FCN),来编码特定于类别的 shape priors[21],改进了该框架
        [8]将Region Proposal Network集成到一个多任务网络casade(集联)用于分割。
    但是,都有bounding box内部分割,的问题。我们用边界感知的OMN预测超出框外的片段,集成到MNC(多任务网络级联)框架中。
框架2:跳过检测部分。
        [22]PFN,预测实例数目,每个像素的语义标签和边界框位置。
            缺点:依赖预测实例数目的准确性。
        [36]基于深度排序识别实例。
        [35]Markov Random Field
            缺点:列深相似情况。
        [33]同时预测深度、语义、direction encoding,然后用模板匹配过程生成实例。
            缺点:不能联合优化,次优问题。
        [29]用RNN
            缺点:认为看到的所有实例属于同一类。
框架3:class-agnostic region proposals[1,34,20](不知类,只区分前景和背景),依赖于深度架构[25, 26]
        [6]:用FCN计算一小组instance-aware的score map,在MNC中有效。
        我们的方法和这些方法有竞争力,甚至更好。此外我们将其集成到完整的实例分割网络中,得到state-of-art。


-------------这么快就看完啦^ω^谢谢阅读哟-------------