- 2022最新!基于深度transformer的时间序列异常检测模型 ⭐⭐
- Abstract: 2022最新!基于深度transformer的时间序列异常检测模型
- Paper: TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate Time Series Data
- Code: https://github.com/imperial-qore/tranad
- Tips: 这是一种基于深度transformer的异常检测和诊断模型,它使用基于注意力的序列编码器来快速执行推理,并了解数据中更广泛的时间趋势。
- 复旦大学数据智能与社会计算实验室推出大规模跨视觉语言模态预训练模型:MVPTR ⭐⭐
- Abstract: 复旦大学数据智能与社会计算实验室推出大规模跨视觉语言模态预训练模型:MVPTR
- Paper: MVPTR: Multi-Stage Vision-Language Pre-Training via Multi-Level Semantic Alignment
- Code: https://github.com/Junction4Nako/mvp_pytorch
- Tips: 本文介绍了Fudan DISC实验室提出的一种基于多层次语义对齐的多阶段视觉-语言预训练模型MVPTR,MVPTR是一个多阶段的视觉-语言表征模型和预训练方法,在大规模图片-文本对语料库上预训练的MVPTR模型在下游视觉-语言任务上取得了明显的进展
- ICCV2021 | 用于视觉跟踪的学习时空型transformer ⭐⭐
- Abstract: 用于视觉跟踪的学习时空型transformer
- Paper: Learning Spatio-Temporal Transformer for Visual Tracking
- Code: https://github.com/researchmm/Stark
- Tips: : 本文介绍了一个端到端的用于视觉跟踪的transformer模型,它能够捕获视频序列中空间和时间信息的全局特征依赖关系。在五个具有挑战性的短期和长期基准上实现了SOTA性能,具有实时性,比Siam R-CNN快6倍。
- Vision Transformer必读系列之图像分类综述:概述 ⭐⭐
- Abstract: Vision Transformer必读系列之图像分类综述
- Code: https://github.com/open-mmlab/awesome-vit
- Tips: 本文将对 Transformer 和 Vision Transformer (ViT) 进行解读,同时还将对 ViT 后续发展进行系统性概述,方便大家把握方向,是本系列文章的重点内容 (由于图像分类内容众多,本文仅仅是全局概述,不涉及思维导图中每篇论文。
- 轻量级人体姿态估计模型的坎坷修炼之路(附MoveNet复现经验) ⭐⭐
- Abstract: 轻量级人体姿态估计模型的坎坷修炼之路(附MoveNet复现经验)
- Tips: 本文记录了作者实现轻量级人体姿态估计模型的全过程,从方案的选取到尝试复现等,详细的叙述了一个项目需求完成的整体思路,并附有谷歌开源的MoveNet的复现经验。
- 健身环爆打老头环,超高难度,已开源! ⭐⭐
- Abstract: 健身环爆打老头环,超高难度,已开源!
- Code: https://github.com/SuperLouis64/RingFitAdventure-PC-Mods
- Tips: 整体的思想就是,将游戏里的一些操作、技能,映射到健身环上操作,边玩游戏边动起来!