Skip to content

Latest commit

 

History

History
76 lines (52 loc) · 5.99 KB

0330.md

File metadata and controls

76 lines (52 loc) · 5.99 KB

公众号内容拓展学习笔记(2022.3.30)


📎 今日要点

  1. CVPR 2022|基于GAN逆映射的高保真图像编辑算法 by 港科大&腾讯AI Lab开源 ⭐⭐
    • Abstract: 基于GAN逆映射的高保真图像编辑算法
    • Paper: High-Fidelity GAN Inversion for Image Attribute Editing
    • Code: https://github.com/Tengfei-Wang/HFGI
    • Tips: 本文提出了一种名为信息参照(information consultation)的方法,同时利用low-rate和high-rate隐编码。该模型包括两个编码器,基础编码器压缩低率隐编码,用于保证图像的可编辑性;参照编码器对低率重建图像的失真信息进行补充编码,得到一个高率的隐编码,补充丢失的细节信息。
  1. CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用 ⭐⭐
  1. CVPR 2022|Adobe提出InsetGAN! 全身都生成,这可太GAN了 ⭐⭐
    • Abstract: Adobe提出InsetGAN! 全身都生成,这可太GAN了
    • Paper: InsetGAN for Full-Body Image Generation
    • Tips: 他们首先引入了一个边界框检测器,检测部分GAN生成的特定区域在底层画布,也就是全身GAN生成的区域中的位置,经过裁剪后再将特定区域嵌入。
  1. Swim-Transform V2:用于目标检测,视觉大模型不再是难题(附源代码) ⭐⭐
  1. CVPR 2022 | 天大本科生论文入选!深度学习长尾分类新SOTA ⭐⭐
    • Abstract: 深度学习长尾分类新SOTA
    • Paper: Trustworthy Long-Tailed Classification
    • Tips: 通过引入不确定性集成,来实现对尾部类别样本的自动感知。在此基础上,提出为尾部类别样本动态分配比头部样本更多的模型资源(experts),以兼顾性能与效率。
  1. 刷新4个SOTA!港大&字节开源ReferFormer: 语言作为查询的视频目标分割框架 ⭐⭐
    • Abstract: 港大&字节开源ReferFormer: 语言作为查询的视频目标分割框架
    • Paper: Language as Queries for Referring Video Object Segmentation
    • Code: https://github.com/wjn922/ReferFormer
    • Tips: 研究者们提出了一种基于Transformer的参考视频目标分割新框架ReferFormer。其将语言描述视为查询条件,直接在视频中查找目标对象,除此之外,通过实例序列的整体输出自然地完成目标物体的跟踪,无需进行任何后处理。

📎 Others

  • 由于图片权限问题,GitHub是完整版,可以点点 star
  • 星标的数量是与个人相关程度,不代表文章内容的好坏
  • 关注我的个人网站
  • 关注我的CSDN博客
  • 关注我的哔哩哔哩
  • 关注我的公众号CV伴读社