计算机视觉与模式识别论文摘要:自助习视觉问

2019-01-09   阅读:146

  不同层次的深度卷积神经网络(CNN)可以对不同层次的信息进行编码。高层特征(就是网络后面层的特征)包含更多的语义信息,低层特征包含更多的细节信息。然而,低层特征存在着背景混乱和语义模糊的问题。在视觉识别过程中,低层、高层特征的组合在上下文调制中起着重要的作用。由于细节信息的引入,直接结合了高、低两层特征,可能造成背景混乱和语义歧义。在本文中,我们提出了一种通用的网络架构,即选择性特征连接机制(Selective Feature Connection Mechanism, SFCM),以一种简单有效的方式连接不同层次的卷积神经网络的特征。低层特征被选择性地连接到高层的特征上。该连接机制能有效克服背景混乱和语义歧义的缺陷。我们证明了该方法在图像分类、场景文本检测、图像到图像转换等具有挑战性的计算机视觉任务中的有效性、优越性和通用性。

  论文摘要:在生物知觉中的注意力机制,它被认为是选择信息的子集,针对更复杂的处理过程,这种处理执行所有感官输入。计算机视觉对硬注意力机制(hard attention)的研究相对较少,这里的一些信息被选择性的忽略。虽然软注意力机制可行,但是这里的信息被重新加权和聚合过了(并且从未过滤)。

  论文中,我们介绍一种实施硬注意力机制(hard attention)的新方法,它在一个最近发布的视觉问答数据集上取得了非常有竞争力的表现。新方法在一些案例上取得了相等和完全超越了类似软注意的架构,尽管这个软注意的架构完全忽略了一些特征。虽然硬注意机制被认为是不可微分的,但我们发现特征量级与语义相关性(semantic relevance)相关,这为我们注意力机制的选择准则提供了有用的信号。因为硬注意选择输入信息的重要特征,它也可以比类似的软注意机制更有效。这对于最近的方法尤其重要:使用非本地的成对(non-local pairwise)操作,依靠计算和内存成本是特征集大小的二次函数。

新媒体

公告点评东方园林:朝阳国资
东方园林发布公告,公司实际控制人与盈润汇民基金管理中心签订了《股份转让协议》,实际控制人将5%股份转让给朝阳区国

海外上市互金平台仍处阵痛期
海外上市的互金平台陆续披露了今年三季报,今年三季度平台营业收入、净利润增幅明显收窄甚至下滑。 受今年年中的暴雷

12月5日四大证券报精华摘要:
随着科创板越来越临近发令枪响,很多相关市场主体愈发心痒难耐、跃跃欲试。而在二级市场,创投概念股更是率先走出一波

今日必读新闻和摘要(124)
中美贸易战暂时停火,暂缓加徵关税,争取90日内达成全面贸易协议,带动投资情绪升温,利好全球股市气氛。科技及工业股