DYC Blog

「想见更大的世界」

mask2former

semantic segmentation

Mask2former motivation 希望能提出一种universal的结构能够完成各种分割任务,包括语义分割和实体分割 contribution 在Transformer解码器中使用了掩蔽注意力,它将注意力限制在以预测片段为中心的局部特征上,这些片段可以是对象,也可以是区域,这取决于用于分组的特定语义。 使用多尺度高分辨率特征来帮助模型分割小对象/区域 ...

maskformer

semantic segmentation

maskformer 分割领域有两个大框架,一方面是像素级分类(per-pixel classification)统治语义分割领域,另一方面是以Mask-FCN为首的掩膜分类(mask classification)统治实例分割、全景分割领域 像素级分类(per-pixel classification):分类损失应用于每个输出像素,将预测图像划分为不同类别的区域; 掩膜分类(mask ...

Rich CNN Features for Water-Body Segmentation from VeryHigh Resolution Aerial and Satellite Imagery

semantic segmentation

Rich CNN Features for Water-Body Segmentation from VeryHigh Resolution Aerial and Satellite Imagery motivation 遥感图像中水体轮廓不清晰 contribution 设计了一种新的多特征提取和组合模块,以考虑来自小感受野和大感受野以及通道之间的特征信息。作为编码器...

swin transformer

semantic segmentation

swin transformer motivation 图像变化很大,不固定 相较于文本信息,图像具有更大的分辨率,意味着计算复杂度要更大 contribution 利用分层结构来处理图像,使模型能够处理不同尺度的图片 使用window self-attention来降低计算复杂度 architecture 由上图可以看出基本流程如下: 首先将...

vision-transformer

semantic segmentation

vision-transformer transformer最开始应用于nlp领域,但其注意力机制的优秀也可以利用在cv领域 architecture vit可以分为以下三个模块 Linear Projection of Flattened Patches Transformer Encoder MLP Head Linear Projection of Fla...

c++刷题

c++

Leetcode-c++ 链表 反转链表 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 /** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode(i...

Transformer

semantic segmentation

Attention is all you need motivation 对于RNN而言,递归式进行,但因为它的特点是需要将历史信息传递给当前步骤,以帮助理解和预测后续数据,这种依赖关系意味着在顺序处理数据时,每个时间步骤必须按顺序计算,无法并行化,因此速度较慢 CNN只能获取局部的感受野,如果想得到全局的需要多尺度融合等方式 contribution 引入自注意力...

Docker入门笔记

Docker Learning

Ⅰ 引言 需要提前掌握的知识: Linux基本命令 计算机网络 Springboot(非必须) 1.1 容器技术的起源 我们考虑这样的场景,公司正在研发一款APP,程序员一开始在自己的设备上搭建了一套环境开始写代码,写完代码后交给测试同学进行测试,这时测试同学也需要重新搭建这套环境,测试人员测完后可以上线,这时运维同学又需要重新搭建这套环境。 从整个过程中我们看到,...

DAnet

semantic segmentation

DANet 与之前通过多尺度特征融合捕获上下文的工作不同,作者提出了一种双重注意网络(DANet)来自适应地集成局部特征及其全局依赖性 motivation 现有的方法提高像素级辨别能力的,包括结合膨胀卷积,下采样等方式来进行多尺度融合,或者编码器-解码器等方式,这些方式虽然有助于捕获不同比例的对象,但却无法利用全局视图中对象之间的关系 为了有效地完成场景分割任务,需要区分一...

DeepLab v3+

semantic segmentation

DeepLabv3+ Motivation 尽管在encode的最后阶段获取了丰富的语义分割信息,但是由于池化或卷积的步长操作,导致细节信息的缺失,使用膨胀卷积虽然能够缓解,但当下采样几倍之后的的计算量是很大的 encoder-decoder模型在encoder的时候计算更快,在decoder的时候能够逐渐回复清晰的边界,所以尝试将两者进行结合 语义分割的两大问题,多尺度信...