公众号内容拓展学习笔记（2022.3.30）

📎 今日要点

CVPR 2022｜基于GAN逆映射的高保真图像编辑算法 by 港科大&腾讯AI Lab开源 ⭐⭐
- Abstract: 基于GAN逆映射的高保真图像编辑算法
- Paper: High-Fidelity GAN Inversion for Image Attribute Editing
- Code: https://github.com/Tengfei-Wang/HFGI
- Tips: 本文提出了一种名为信息参照（information consultation）的方法，同时利用low-rate和high-rate隐编码。该模型包括两个编码器，基础编码器压缩低率隐编码，用于保证图像的可编辑性；参照编码器对低率重建图像的失真信息进行补充编码，得到一个高率的隐编码，补充丢失的细节信息。

CVPR 2022 | 华南理工提出VISTA：双跨视角空间注意力机制实现3D目标检测SOTA，即插即用 ⭐⭐
- Abstract: 华南理工提出VISTA：双跨视角空间注意力机制实现3D目标检测SOTA，即插即用
- Paper: VISTA: Boosting 3D Object Detection via Dual Cross-VIew SpaTial Attention
- Code: https://github.com/Gorilla-Lab-SCUT/VISTA
- Tips: 本文提出了 VISTA，一种新颖的即插即用多视角融合策略，用于准确的 3D 对象检测。为了使 VISTA 能够关注特定目标而不是一般点，研究者提出限制学习的注意力权重的方差。将分类和回归任务解耦以处理不平衡训练问题。

CVPR 2022｜Adobe提出InsetGAN！全身都生成，这可太GAN了 ⭐⭐
- Abstract: Adobe提出InsetGAN！全身都生成，这可太GAN了
- Paper: InsetGAN for Full-Body Image Generation
- Tips: 他们首先引入了一个边界框检测器，检测部分GAN生成的特定区域在底层画布，也就是全身GAN生成的区域中的位置，经过裁剪后再将特定区域嵌入。

Swim-Transform V2：用于目标检测，视觉大模型不再是难题（附源代码） ⭐⭐
- Abstract: Swim-Transform V2：用于目标检测，视觉大模型不再是难题（附源代码）
- Paper: Swin Transformer V2: Scaling Up Capacity and Resolution
- Code: https://github.com/microsoft/Swin-Transformer
- Tips: MSRA时隔大半年放出了Swin Transformer 2.0版本，在1.0版本的基础上做了改动，使得模型规模更大并且能适配不同分辨率的图片和不同尺寸的窗口！这也证实了，Transformer将是视觉领域的研究趋势！

CVPR 2022 | 天大本科生论文入选！深度学习长尾分类新SOTA ⭐⭐
- Abstract: 深度学习长尾分类新SOTA
- Paper: Trustworthy Long-Tailed Classification
- Tips: 通过引入不确定性集成，来实现对尾部类别样本的自动感知。在此基础上，提出为尾部类别样本动态分配比头部样本更多的模型资源（experts），以兼顾性能与效率。

刷新4个SOTA！港大&字节开源ReferFormer: 语言作为查询的视频目标分割框架 ⭐⭐
- Abstract: 港大&字节开源ReferFormer: 语言作为查询的视频目标分割框架
- Paper: Language as Queries for Referring Video Object Segmentation
- Code: https://github.com/wjn922/ReferFormer
- Tips: 研究者们提出了一种基于Transformer的参考视频目标分割新框架ReferFormer。其将语言描述视为查询条件，直接在视频中查找目标对象，除此之外，通过实例序列的整体输出自然地完成目标物体的跟踪，无需进行任何后处理。

📎 Others

由于图片权限问题，GitHub是完整版，可以点点 star
星标的数量是与个人相关程度，不代表文章内容的好坏
关注我的个人网站
关注我的CSDN博客
关注我的哔哩哔哩
关注我的公众号CV伴读社