- 全面超越Swin Transformer | Facebook用ResNet思想升级MViT ⭐⭐
- Abstract: Facebook用ResNet思想升级MViT
- Paper: Improved Multiscale Vision Transformers for Classification and Detection
- Tips: 作者提出了一个MViT的改进版本,它结合了分解的相对位置嵌入和池化残差连接
- 零样本目标检测:鲁棒的区域特征合成器用于目标检测(附论文下载) ⭐⭐
- Abstract: 零样本目标检测:鲁棒的区域特征合成器用于目标检测
- Paper: Robust Region Feature Synthesizer for Zero-Shot Object Detection
- Tips: 研究者设计了一个统一的区域特征合成器,用于在现实世界检测场景中进行特征合成,其中包含一个类内语义发散组件和一个类间结构保持组件
- AI 编辑视频!这特效太逆天了!代码开源 SIGGRAPH Asia 2021 ⭐⭐
- Abstract: AI 编辑视频,增加特效
- Paper: Layered Neural Atlases for Consistent Video Editing
- Code: https://github.com/ykasten/layered-neural-atlases
- Tips: 可以实现的效果包括删除视频中的物体、可以对视频内的物体进行编辑、风格化迁移等等
- Yolo-Z:改进的YOLOv5用于小目标检测(附原论文下载) ⭐⭐
- Abstract: Yolo-Z:改进的YOLOv5用于小目标检测
- Paper: YOLO-Z: Improving small object detection in YOLOv5 for autonomous vehicles
- Tips: 聚焦小目标检测,改变了YOLOV5的部分网络结构
- 有人用YOLOv5和CLIP做了一个找图神器!搜图、裁剪一步到位!在线可试玩... ⭐⭐
- Abstract: 用YOLOv5和CLIP做了一个找图神器
- Code: https://github.com/vijishmadhavan/Crop-CLIP
- Demo: https://huggingface.co/spaces/Vijish/Crop-CLIP
- Tips: 和目标检测器 YOLOv5 相结合之后,CLIP 在语义搜索图像的基础上增加了裁剪能力,变身 Crop-CLIP
- 聊聊我常用的两个可视化工具,Echarts和Tableau ⭐⭐
- Abstract: 常用的两个可视化工具,Echarts和Tableau
- Echarts: https://echarts.apache.org/zh/tutorial.html
- Tableau: https://help.tableau.com/current/pro/desktop/zh-cn/default.htm