- M-CenterNet:多中心点的CenterNet ⭐⭐
- Abstract: M-CenterNet:多中心点的CenterNet
- Paper: Tiny Object Detection in Aerial Images
- Code: https://github.com/jwwangchn/AI-TOD
- Tips: 我们基于CenterNet,提出了一种多中心点的网络(M-CenterNet),可以提升小目标的检测能力,并且实验表明,该方法能够明显提升小目标检测效果。
- 多尺度特征融合:为检测学习更好的语义信息(附论文下载) ⭐⭐
- Abstract: 多尺度特征融合:为检测学习更好的语义信息
- Paper: MULTI-SCALE FEATURE FUSION: LEARNING BETTER SEMANTIC SEGMENTATION FOR ROAD POTHOLE DETECTION
- Tips: 本文提出了一种基于单模态语义分割的新型坑洼检测方法。
- AI大一统:阿里达摩院发布多任务、多模态统一模型OFA ⭐⭐
- Abstract: AI大一统:阿里达摩院发布多任务、多模态统一模型OFA
- Paper: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework
- Code: https://github.com/OFA-Sys/OFA
- Tips: 本文介绍的统一模型OFA是一个与任务无关、模态无关的综合性、大一统模型,能够实现多模态和单模态理解和生成,无需在附加层或任务中指定。
- 打打字就能指挥算法视频抠图,Transformer掌握跨模态新技能,精度优于现有模型丨CVPR 2022 ⭐⭐
- Abstract: Transformer掌握跨模态新技能,实现视频抠图
- Paper: End-to-End Referring Video Object Segmentation with Multimodal Transformers
- Code: https://github.com/mttr2021/MTTR
- Demo: https://huggingface.co/spaces/akhaliq/MTTR
- Tips: 研究人员意识到,视频和文本可以同时通过单个多模态Transformer模型进行有效处理。因此提出了这个叫做MTTR (Multimodal Tracking Transformer)的新架构,将RVOS任务建模为序列(sequence)预测问题。
- ACM MM 2021 | FedUReID:联邦无监督行人重识别训练 ⭐⭐
- Abstract: FedUReID:联邦无监督行人重识别训练
- Paper: Joint Optimization in Edge-Cloud Continuum for Federated Unsupervised Person Re-identification
- Tips: 本文提出了联邦无监督行人重识别系统 FedUReID,实现了使用无标注行人重识别数据进行分布式联邦学习,同时还保护了数据隐私。不仅如此,我们采用边云联合优化的方法进一步解决了数据异构性的问题。
- 提升精度 | 新的小样本学习算法提升物体识别精度(附论文地址) ⭐⭐
- Abstract: 新的小样本学习算法提升物体识别精度
- Paper: DeepEMD: Differentiable Earth Mover’s Distance for Few-Shot Learning
- Tips: 而本文将图片拆分成多个图块,然后引入一种新的距离度量方式陆地移动距离(Earth Mover’s Distance,EMD),计算查询集和支持集图像的各个图块之间的最佳匹配代价来表示二者之间的相似程度。