摩杜云开发者社区-摩杜云

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.20]

检测相关(4篇) 【1】AnomalyHeterogeneityLearningforOpen-setSupervisedAnomalyDetection 标题：开集监督异常检测中的异常异构性学习 https://arxiv.org/abs/2310.12790 开集监督异常检测（OSAD）-最近出现的异常检测领域-旨在利用在训练期间看到的异常类的一些样本来检测看不见的异常（即，来自开集异常类的样本），同时有效地识别所看到的异常。受益于所看到的异常所示的先验知识，当前的OSAD方法通常可以大大减少误报错误。然而，这些方法将异常示例视为来自均匀分布，使得它们在推广到可以从任何分布得出的不可见...

tuO6pNMYWTyk 2023年11月13日 12 0 0 异构异构目标检测异常检测异常检测目标检测

【Git】Git 拉取的快速方法（含项目示例）

一、问题的提出在我们之前的拉取中，速度可能比较慢，例如，我们要拉取CLIP的项目。 (ldm)root@I1385efcc2300601b29:/hy-tmp/latent-diffusionpipinstallgit+https://github.com/openai/CLIP.git Lookinginindexes:https://pypi.tuna.tsinghua.edu.cn/simple Collectinggit+https://github.com/openai/CLIP.git Cloninghttps://github.com/openai/CLIP.gitto/tm...

tuO6pNMYWTyk 2023年11月12日 13 0 0 github github git python python git

计算机视觉与模式识别学术速递[10.13]

一、检测相关(6篇) 1.1UniPose:DetectingAnyKeypoints https://arxiv.org/abs/2310.08530 这项工作提出了一个统一的框架，称为UniPose，以检测任何关节的关键点（例如，人和动物）、刚性和柔软对象，以进行细粒度视觉理解和操纵。关键点是任何对象（尤其是铰接对象）的结构感知、像素级和紧凑表示。现有的细粒度可识别任务主要集中在对象实例的检测和分割上，但往往无法识别图像和实例的细粒度和结构化信息，如眼睛、腿、爪子等。与此同时，基于特征的关键点检测仍处于探索阶段。为了弥补这一差距，我们首次尝试开发一个端到端的基于关键点检测的框架，称为U...

tuO6pNMYWTyk 2023年11月12日 17 0 0 模态点云细粒度细粒度模态点云

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.25]

检测相关(5篇) 【1】DecoupledDETR:SpatiallyDisentanglingLocalizationandClassificationforImprovedEnd-to-EndObjectDetection 标题：解耦DETR：改进端到端目标检测的空间解缠定位和分类 https://arxiv.org/abs/2310.15955 DETR的引入代表了对象检测的新范式。然而，它的解码器使用共享查询和交叉注意层进行分类和框定位，导致次优结果。我们观察到，视觉特征图中的不同感兴趣区域适合执行查询分类和框本地化任务，即使是同一对象。显著区域为分类提供了重要信息，而它们周围的边...

tuO6pNMYWTyk 2023年11月02日 27 0 0 3D 3D 模态数据集数据集模态

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.24]

检测相关(12篇) 【1】OnlineDetectionofAI-GeneratedImages 标题：人工智能生成图像的在线检测 https://arxiv.org/abs/2310.15150 随着人工智能生成图像的不断进步，越来越难以区分传统来源的图像（例如，照片，艺术品）从AI生成的。以前的检测方法研究的泛化从一个单一的发电机到另一个孤立的。然而，在现实中，新的发电机是在流的基础上发布的。我们在这种情况下研究泛化，在N个模型上进行训练，在下一个（N+k）上进行测试，遵循众所周知的生成方法的历史发布日期。此外，图像越来越多地由真实和生成的组件组成，例如通过图像修复。因此，我们将这种方...

tuO6pNMYWTyk 2023年11月02日 52 0 0 数据集目标检测数据数据集数据目标检测

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.23]

检测相关(5篇) 【1】Deep-Learning-basedChangeDetectionwithSpaceborneHyperspectralPRISMAdata 标题：基于深度学习的星载高光谱棱镜数据变化检测 https://arxiv.org/abs/2310.13627 变化检测（CD）方法已被应用于光学数据几十年，而使用高光谱数据与精细的光谱分辨率一直很少探索。光盘应用于若干部门，如环境监测和灾害管理。由于PRISMA，现在可以从空间获得高光谱CD。在这项工作中，我们将标准和深度学习（DL）CD方法应用于不同的目标，从自然到城市地区。我们提出了一个管道从配准，其次是CD与全光谱...

tuO6pNMYWTyk 2023年11月02日 41 0 0 深度学习目标检测深度学习数据数据目标检测

【计算机视觉】计算机视觉与模式识别关于图像分割的学术速递[10.23]

分割|语义相关(7篇) 【1】ROSS:RadarOff-roadSemanticSegmentation 标题：Ross：雷达越野语义切分 https://arxiv.org/abs/2310.13551 随着对越野环境中自主导航需求的增加，对了解这些环境的有效解决方案的需求变得至关重要。在这项研究中，我们面对的语义分割在雷达数据越野场景的固有复杂性。我们提出了一种新的管道，利用激光雷达数据和现有的注释越野激光雷达数据集生成雷达标签，其中雷达数据表示为图像。经过真实世界数据集的验证，我们务实的方法强调了雷达技术在越野环境中导航应用的潜力。【2】TechnicalReportforICC...

tuO6pNMYWTyk 2023年11月02日 26 0 0 数据集解决方案数据数据集数据解决方案

【计算机视觉】计算机视觉与模式识别关于图像分割的学术速递[10.20]

分割|语义相关(8篇) 【1】PuttingtheObjectBackintoVideoObjectSegmentation 标题：将对象放回视频对象分割中 https://arxiv.org/abs/2310.12982 我们提出了Cutie，一个具有对象级内存读取的视频对象分割（VOS）网络，它将内存中的对象表示放回视频对象分割结果中。最近的VOS工作采用自下而上的像素级内存读取，由于匹配噪声，特别是在干扰项的存在下，导致性能较低，更具挑战性的数据。相比之下，Cutie执行自顶向下的对象级内存读取，通过调整一小组对象查询来重构，并使用基于查询的对象Transformer（qt，因此是C...

tuO6pNMYWTyk 2023年11月02日 60 0 0 深度学习数据集深度学习数据数据集数据

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.17]（上）

检测相关(17篇) 【1】ObjectDetectioninAerialImagesinScarceDataRegimes 标题：稀缺数据环境下航拍图像的目标检测 https://arxiv.org/abs/2310.10433 大多数关于Few-Shot目标检测（FSOD）的研究成果只在自然图像上进行了评估，但对于其他类型图像的应用，并不能保证其性能的可移植性。我们证明了这一点，深入分析现有的FSOD方法对航空图像，并观察到一个很大的性能差距相比，自然图像。在航空图像中数量更多的小物体是自然图像和航空图像之间明显性能差距的原因。因此，我们提高了FSOD性能的小对象与精心设计的注意力机制。...

tuO6pNMYWTyk 2023年11月02日 46 0 0 3D 3D 目标检测目标检测

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.18]

检测相关(5篇) 【1】TowardsGeneralizableMulti-Camera3DObjectDetectionviaPerspectiveDebiasing 标题：基于视角去偏的通用型多摄像机三维目标检测 https://arxiv.org/abs/2310.11346 使用多个相机检测3D空间中的对象，称为多相机3D对象检测（MC3D-Det），随着鸟瞰图（BEV）方法的出现而变得突出。然而，这些方法在面对不熟悉的测试环境时往往会遇到困难，因为缺乏包含各种观点和环境的各种训练数据。为了解决这个问题，我们提出了一种新的方法，将3D检测与2D相机平面结果对齐，确保一致和准确的检测...

tuO6pNMYWTyk 2023年11月02日 22 0 0 3D 3D 无人机目标检测无人机目标检测

【计算机视觉】计算机视觉与模式识别关于图像分割的学术速递[10.16]

分割|语义相关(8篇) 【1】SAIR:LearningSemantic-awareImplicitRepresentation 标题：SAIR：学习语义感知的隐式表征 https://arxiv.org/abs/2310.09285 图像的隐式表示可以将连续域中的任意坐标映射到其对应的颜色值，表现出强大的图像重建能力。然而，现有的隐式表示方法只注重建立连续的外观映射，忽略了跨像素的语义信息的连续性。因此，当输入图像中的语义信息被破坏时，例如，大区域丢失时，它们很难达到期望的重建结果。为了解决这个问题，我们提出了学习语义感知隐式表示（SAIR），也就是说，我们使每个像素的隐式表示依赖于它的...

tuO6pNMYWTyk 2023年11月02日 19 0 0 3D 3D 柱状图图像分割图像分割柱状图

【计算机视觉】计算机视觉与模式识别关于目标检测的学术速递[10.16]

检测相关(6篇) 【1】TimeCNNandGraphConvolutionNetworkforEpilepticSpikeDetectioninMEGData 标题：时间CNN和图形卷积网络用于脑磁图数据中癫痫峰电位的检测 https://arxiv.org/abs/2310.09236 癫痫患者的脑磁图（MEG）记录显示尖峰，这是病理学的典型生物标志物。检测这些尖峰可以准确定位触发癫痫发作的大脑区域。尖峰检测通常手动执行。然而，由于MEG数据的复杂性，这是一项繁重且容易出错的任务。为了解决这个问题，我们提出了一个一维时间卷积神经网络（时间CNN）与图形卷积网络（GCN）耦合，以分类短时...

tuO6pNMYWTyk 2023年11月02日 48 0 0 全景视频目标检测自适应自适应目标检测全景视频

【计算机视觉 | 目标检测】YOLO-NAS的介绍以及如何使用？（含源代码）

一、介绍 Github 仓库： https://github.com/Deci-AI/super-gradients/blob/master/YOLONAS.md 1.1亮点参考QARepVGG，该方案引入了QSP与QCI模块以同时利用重参数与8-bit量化的优化；该方案采用AutoNAC搜索最优尺寸、每个stage的结构，含模块类型、数量以及通道数；采用混合量化机制进行模型量化，既考虑了每一层对精度与延迟的影响，也考虑了8-bit与16-bit之间切换对整体延迟的影响；预训练方案：automaticallylabeleddata,self-distillation,...

tuO6pNMYWTyk 2023年11月02日 19 0 0 v8 v8 目标检测 python python 目标检测

【计算机视觉】Segment Anything(SAM)项目整理汇总（更新到9月）

自从sam模型发布以来，基于sam的二次应用及衍生项目越来越多，将其应用于各种任务，比如图像修复(imageinpainting)、图像编辑（imageediting）、目标检测（objectsdetection）、图像标注（ImageCaption）、视频跟踪(objecttracking)、3d检测等等。参考项目如下： 1. https://github.com/IDEA-Research/Grounded-Segment-Anything 2. https://github.com/MaybeShewill-CV/segment-anything-u-specify 3. https:...

tuO6pNMYWTyk 2023年11月02日 29 0 0 计算机视觉目标检测语义分割 SAM 计算机视觉 CLIP 语义分割目标检测 SAM CLIP

【计算机视觉 | 目标检测 | 图像分割】Grounded Segment Anything：Grounding DINO + Segment Anything Model (SAM)介绍

集成SAM，可以通过文本提示做检测/分割等任务。我们计划通过结合Grounding DINO 和SegmentAnything来创建一个非常有趣的演示，旨在通过文本输入检测和分割任何内容！并且我们会在此基础上不断完善它，创造出更多有趣的demo。我们非常愿意帮助大家分享和推广基于Segment-Anything的新项目，更多精彩的demo和作品请查看社区：亮点扩展项目。您可以提交新问题（带有项目标签）或新拉取请求以添加新项目的链接。该项目背后的核心思想是结合不同模型的优势，构建一个非常强大的管道来解决复杂问题。值得一提的是，这是一个组合强专家模型的工作流程，其中...

tuO6pNMYWTyk 2023年11月02日 64 0 0 torch torch Grounding DINO python SAM python Grounding DINO SAM

【计算机视觉】Segment Anything 安装配置及代码测试（含源代码）

一、前言目前代码已经开源！ SegmentAnythingModel（SAM）可以从输入提示（如点或框）生成高质量的物体遮罩，并且可以用于为图像中的所有物体生成遮罩。它在一个包含1100万张图像和10亿个遮罩的数据集上进行了训练，并且在各种分割任务上表现出了强大的零样本性能。二、安装 2.1基本要求该代码要求使用python>=3.8，并且需要安装pytorch>=1.7和torchvision>=0.8。请按照以下说明安装PyTorch和TorchVision的依赖项。强烈建议同时安装支持CUDA的PyTorch和TorchVision。以下是安装步骤的一般...

tuO6pNMYWTyk 2023年11月02日 19 0 0 分割一切分割一切语义分割 SAM CUDA CUDA 语义分割 SAM

工业异常检测最新SOTA方案分享！

在实际的工业质量检测工作中，如何快速发现产品的异常区域是业内人士需要关注的重点，而在这一领域，目标检测发挥着重要的作用。为了更高效地解决工业场景中的这一问题，近年来工业异常检测出现了许多值得一看的突破性成果，我简单整理了一部分，今天就来和同学们分享分享。一、DeepLearningforUnsupervisedAnomalyLocalizationinIndustrialImages:ASurvey 工业图像无监督异常检测中的深度学习综述「简述：」本文对基于深度学习的工业图像无监督异常定位方法进行全面调研，内容涵盖异常定位的概念、挑战、分类、数据集、算法比较等。通过回顾已有成就，预测未来...

tuO6pNMYWTyk 2023年11月02日 22 0 0 模态数据集异常检测数据集异常检测模态

【计算机视觉】ICCV 2023最佳论文开奖！ControlNet、「分割一切」等热门论文获奖

上周计算机视觉三大顶级会议之一的ICCV2023在法国巴黎正式“开奖”了！今年共有两篇论文获得最佳论文奖，大名鼎鼎的“分割一切”荣获最佳论文提名。 ICCV今年共收录了2160篇论文，从今年的录用论文的主题领域来看，3D视觉、图像视频合成、迁移少样本持续学习方向排名前三。最佳论文奖 AddingConditionalControltoText-to-ImageDiffusionModels 标星2.4万，被引用量已破300+ 「标题：」向文本到图像扩散模型添加条件控制「作者：」斯坦福大学「内容：」论文提出了ControlNet，这是一种神经网络架构，可向大型预训练的文本到图像扩散模型添...

tuO6pNMYWTyk 2023年11月02日 22 0 0 计算机视觉论文论文 SAM 计算机视觉 ICCV ICCV SAM

【计算机视觉】YOLOv8参数讲解

comments description keywords true MasterYOLOv8settingsandhyperparametersforimprovedmodelperformance.LearntouseYOLOCLIcommands,adjusttrainingsettings,andoptimizeYOLOtasks&modes. YOLOv8,settings,hyperparameters,YOLOCLIcommands,YOLOtasks,YOLOmodes,Ultralyticsdocumentation,modeloptimizati...

tuO6pNMYWTyk 2023年11月02日 23 0 0 v8 v8 YOLO YOLO 数据集参数 ide 数据集 ide 参数