深度学习笔记-HRNet | DaneSun's Blog

深度学习__2022-09-16+16_30_48

简介

HRNet是由中科大与微软亚洲研究院共同提出，发表于CVPR2019，论文名为Deep High-Resolution Representation Learning for Human Pose Estimation。论文提出了一种针对类似于人体姿态检测这种高分辨率场景下的视觉任务的网络结构。

在此之前，主流的网络结构大多都是将分类网络作为backbone，进行特征提取，形成低分辨率的特征图，再通过上采样的方式将分辨率提高。这种方法对于高分辨率任务来说，会丢失大量原有的高分辨率信息，从而降低模型效果。

HRNet提出了一种并行的网络架构，由主分支始终保持高分辨率的特征，随后通过下采样并行加入低分辨率的分支以获取更大感受野下的抽象特征，然后将高分辨率与低分辨率的信息相互交换，使得主分支能得到更大感受野下的特征信息，同时低分辨率层也能获得细节特征。最后由高分辨率的分支输出最后的学习结果，也就是说引入的低分辨率分支的目的不再是为了特征的融合，而是为了让主分支在关注局部特征的同时也能关注全局信息。