DYC Blog

「想见更大的世界」

后处理

semantic segmentation

数据后处理 腐蚀膨胀 用来处理图形问题上。总结性的来说: + 膨胀用来处理缺陷问题; + 腐蚀用来处理毛刺问题 膨胀 首先指定对每个像素点膨胀的范围,比如指定范围为3 * 3的矩阵,卷积计算后,该像素点的值等于以该像素点为中心的3 * 3范围内的最大值。如果是二值图像,所以只要包含周围白的部分,就变为白的。 1 2 3 kernel = np.ones((3, 3), dtype=...

数据结构学习

数据结构

数据结构学习 数据结构:线性结构+非线形结构 线性结构 非线形结构 数组、广义表、树、图 稀疏数组 处理方式 实例 稀疏矩阵与二维数组转化思路 代码实现 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 3...

DDRNet

semantic segmentation

DDRNet motivation 现在语义分割模型很多通过消耗时间来提高性能,很多实时的网络 contribution 提出了一组用于实时语义分割的高效骨干网,提出的深度双分辨率网络由两个深度分支组成,在两个分支之间进行多次双边融合 设计了一种新的上下文信息提取器DAPPM模块,能够扩大感受野和融合多尺度低分辨率的上下文内容 DDRNets在分割精度和推理速度...

pidnet

semantic segmentation

pidnet motivation 双分支模型高分辨率与低频上下文信息直接融合导致出现细节信息特征容易被周围上下文淹没的问题 contribution 将CNN和PID联系起来,并提出了一个基于PID控制器架构的三分支网络 提出了Bag融合模块,用于平衡细节和上下文特征 architecture 作者认为每个对象内部像素的语义是一致的,并且只在相邻对象的边界上...

mask2former

semantic segmentation

Mask2former motivation 希望能提出一种universal的结构能够完成各种分割任务,包括语义分割和实体分割 contribution 在Transformer解码器中使用了掩蔽注意力,它将注意力限制在以预测片段为中心的局部特征上,这些片段可以是对象,也可以是区域,这取决于用于分组的特定语义。 使用多尺度高分辨率特征来帮助模型分割小对象/区域 ...

maskformer

semantic segmentation

maskformer 分割领域有两个大框架,一方面是像素级分类(per-pixel classification)统治语义分割领域,另一方面是以Mask-FCN为首的掩膜分类(mask classification)统治实例分割、全景分割领域 像素级分类(per-pixel classification):分类损失应用于每个输出像素,将预测图像划分为不同类别的区域; 掩膜分类(mask ...

Rich CNN Features for Water-Body Segmentation from VeryHigh Resolution Aerial and Satellite Imagery

semantic segmentation

Rich CNN Features for Water-Body Segmentation from VeryHigh Resolution Aerial and Satellite Imagery motivation 遥感图像中水体轮廓不清晰 contribution 设计了一种新的多特征提取和组合模块,以考虑来自小感受野和大感受野以及通道之间的特征信息。作为编码器...

swin transformer

semantic segmentation

swin transformer motivation 图像变化很大,不固定 相较于文本信息,图像具有更大的分辨率,意味着计算复杂度要更大 contribution 利用分层结构来处理图像,使模型能够处理不同尺度的图片 使用window self-attention来降低计算复杂度 architecture 由上图可以看出基本流程如下: 首先将...

vision-transformer

semantic segmentation

vision-transformer transformer最开始应用于nlp领域,但其注意力机制的优秀也可以利用在cv领域 architecture vit可以分为以下三个模块 Linear Projection of Flattened Patches Transformer Encoder MLP Head Linear Projection of Fla...

c++刷题

c++

Leetcode-c++ 链表 反转链表 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 /** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode(i...