DYC Blog

「想见更大的世界」

maskformer

semantic segmentation

maskformer 分割领域有两个大框架,一方面是像素级分类(per-pixel classification)统治语义分割领域,另一方面是以Mask-FCN为首的掩膜分类(mask classification)统治实例分割、全景分割领域 像素级分类(per-pixel classification):分类损失应用于每个输出像素,将预测图像划分为不同类别的区域; 掩膜分类(mask ...

Rich CNN Features for Water-Body Segmentation from VeryHigh Resolution Aerial and Satellite Imagery

semantic segmentation

Rich CNN Features for Water-Body Segmentation from VeryHigh Resolution Aerial and Satellite Imagery motivation 遥感图像中水体轮廓不清晰 contribution 设计了一种新的多特征提取和组合模块,以考虑来自小感受野和大感受野以及通道之间的特征信息。作为编码器...

swin transformer

semantic segmentation

swin transformer motivation 图像变化很大,不固定 相较于文本信息,图像具有更大的分辨率,意味着计算复杂度要更大 contribution 利用分层结构来处理图像,使模型能够处理不同尺度的图片 使用window self-attention来降低计算复杂度 architecture 由上图可以看出基本流程如下: 首先将...

vision-transformer

semantic segmentation

vision-transformer transformer最开始应用于nlp领域,但其注意力机制的优秀也可以利用在cv领域 architecture vit可以分为以下三个模块 Linear Projection of Flattened Patches Transformer Encoder MLP Head Linear Projection of Fla...

c++刷题

c++

Leetcode-c++ 链表 反转链表 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 /** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode(i...

Transformer

semantic segmentation

Attention is all you need motivation 对于RNN而言,递归式进行,但因为它的特点是需要将历史信息传递给当前步骤,以帮助理解和预测后续数据,这种依赖关系意味着在顺序处理数据时,每个时间步骤必须按顺序计算,无法并行化,因此速度较慢 CNN只能获取局部的感受野,如果想得到全局的需要多尺度融合等方式 contribution 引入自注意力...

Docker入门笔记

Docker Learning

Ⅰ 引言 需要提前掌握的知识: Linux基本命令 计算机网络 Springboot(非必须) 1.1 容器技术的起源 我们考虑这样的场景,公司正在研发一款APP,程序员一开始在自己的设备上搭建了一套环境开始写代码,写完代码后交给测试同学进行测试,这时测试同学也需要重新搭建这套环境,测试人员测完后可以上线,这时运维同学又需要重新搭建这套环境。 从整个过程中我们看到,...

DAnet

semantic segmentation

DANet 与之前通过多尺度特征融合捕获上下文的工作不同,作者提出了一种双重注意网络(DANet)来自适应地集成局部特征及其全局依赖性 motivation 现有的方法提高像素级辨别能力的,包括结合膨胀卷积,下采样等方式来进行多尺度融合,或者编码器-解码器等方式,这些方式虽然有助于捕获不同比例的对象,但却无法利用全局视图中对象之间的关系 为了有效地完成场景分割任务,需要区分一...

DeepLab v3+

semantic segmentation

DeepLabv3+ Motivation 尽管在encode的最后阶段获取了丰富的语义分割信息,但是由于池化或卷积的步长操作,导致细节信息的缺失,使用膨胀卷积虽然能够缓解,但当下采样几倍之后的的计算量是很大的 encoder-decoder模型在encoder的时候计算更快,在decoder的时候能够逐渐回复清晰的边界,所以尝试将两者进行结合 语义分割的两大问题,多尺度信...

DeepLab v3

semantic segmentation

DeepLab v3 对于语义分割而言,下采样是必不可少的,首先 stride>1 的下采样层对于提升感受野非常重要,这样高层特征语义更丰富,而且对于分割来说较大的感受野也至关重要;另外的一个现实问题,没有下采样层,特征图一直保持原始大小,计算量是非常大的。 但为了得到高分辨率的特征,一般有两种方法,第一种是采用EncoderDecoder 结构,类似于U-NET结构,并且Deco...