OpenCV是一个(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。在学习过程中遇到问题最好的办法就是查询opencv官方文档。 1.图像的读取、显示与写入 图像的读取、显示与写入分别对应三个函数,cv2.imread()、cv2.imshow()、cv2.imwrite()。 1.1.读取图像 语法:cv2.imread(filename[,flags])--->image参数:filen...

  yrkuTxKm86wu   2023年11月01日   56   0   0 AI综合

本文的主要内容是利用pytorch框架与torchvision工具箱,进行准备数据集、构建CNN网络模型、训练模型、保存和加载自定义模型等工作。本文若有疏漏、需更正、改进的地方,望读者予以指正,如果本文对您有一定点帮助,请您给个赞、推荐和关注哦,在此,谢谢大家啦!!!笔者的运行环境:CPU(AMDRyzen™54600U)+pytorch(1.13,CPU版)+jupyter;本文所用到的资源:链接:https://pan.baidu.com/s/1WgW3IK40Xf_Zci7D_BVLRg提取码:1212 1.torchvision工具箱 1.1.torchvision简介 torchv...

  yrkuTxKm86wu   2023年11月01日   67   0   0 AI综合

本文是利用pytorch自定义CNN网络系列的第一篇,主要介绍torchvision工具箱及其使用,关于本系列的全文见这里。笔者的运行环境:CPU(AMDRyzen™54600U)+pytorch(1.13,CPU版)+jupyter;本文所用到的资源:链接:https://pan.baidu.com/s/1WgW3IK40Xf_Zci7D_BVLRg提取码:1212 1.torchvision简介 torchvision是基于pytorch的工具箱,主要用来处理图像数据,其内包含一些常用的数据集、模型、图像转换等。torchvision工具箱主要包含以下四大模块: torchvision....

  yrkuTxKm86wu   2023年11月01日   55   0   0 AI综合

本文是利用pytorch自定义CNN网络系列的第二篇,主要介绍构建网络前数据集的准备,关于本系列的全文见这里。笔者的运行环境:CPU(AMDRyzen™54600U)+pytorch(1.13,CPU版)+jupyter;本文所用到的资源:链接:https://pan.baidu.com/s/1WgW3IK40Xf_Zci7D_BVLRg提取码:1212在训练网络模型时,我们可以使用torchvision库自带的数据集(torchvision.datasets),也可以使用自己的数据集。实际运用中一般都是使用自己的数据集,本文就讲一下该如何准备自己的数据。这里呢,笔者偷了个懒,我使用的是下载好...

  yrkuTxKm86wu   2023年11月01日   62   0   0 AI综合

本文是利用pytorch自定义CNN网络系列的第三篇,主要介绍如何构建一个CNN网络,关于本系列的全文见这里。笔者的运行环境:CPU(AMDRyzen™54600U)+pytorch(1.13,CPU版)+jupyter;本文所用到的资源:链接:https://pan.baidu.com/s/1WgW3IK40Xf_Zci7D_BVLRg提取码:1212 1.如何让构建一个CNN模型 构建模型的过程就是对CNN原理的代码实现,我们已经了解到CNN内部包含有卷积层、池化层、全连接层等网络层,模型的构建就是对这些层的实现以及链接。CNN的模型的实现依赖pytorch中的torch.nn模块,而to...

  yrkuTxKm86wu   2023年11月01日   123   0   0 AI综合

本文是利用pytorch自定义CNN网络系列的第四篇,主要介绍如何训练一个CNN网络,关于本系列的全文见这里。笔者的运行环境:CPU(AMDRyzen™54600U)+pytorch(1.13,CPU版)+jupyter; 训练模型是为了得到合适的参数权重,设计模型的训练时,最重要的就是损失函数和优化器的选择。损失函数(Lossfunction)是用于衡量模型所作出的预测离真实值(GroundTruth)之间的偏离程度,损失函数值越小,模型的鲁棒性越好。当损失函数值过大时,我们就需要借助优化器(Optimizer)对模型参数进行更新,使预测值和真实值的偏离程度减小。 1.损失函数 在机器学习...

  yrkuTxKm86wu   2023年11月01日   36   0   0 AI综合

本文转载自:PyTorch|保存和加载模型 1.简介 本文主要介绍如何加载和保存PyTorch的模型。这里主要有三个核心函数: torch.save:把序列化的对象保存到硬盘。它利用了Python的pickle来实现序列化。模型、张量以及字典都可以用该函数进行保存; torch.load:采用pickle将反序列化的对象从存储中加载进来。 torch.nn.Module.load_state_dict:采用一个反序列化的state_dict加载一个模型的参数字典。 本文主要内容如下: 什么是状态字典(state_dict)? 预测时加载和保存模型 加载和保存一个通用的检查点(Checkp...

  yrkuTxKm86wu   2023年11月01日   157   0   0 AI综合

“工欲善其事,必先利其器”,掌握ResNet网络有必要先了解其原理和源码。本文分别从原理、源码、运用三个方面出发行文,先对ResNet原理进行阐述,然后对pytorch中的源码进行详细解读,最后再基于迁移学习对模型进行调整、实战。本文若有疏漏、需更正、改进的地方,望读者予以指正!!!笔者的运行环境:CPU(AMDRyzen™54600U)+pytorch(1.13,CPU版)+jupyter;本文所用的资源链接:https://pan.baidu.com/s/1YWZJTbA7BkmbRnBRFU1qdw;提取码:1212。 1.ResNet网络原理 1.1.深度网络的退化问题 从经验来看,网...

  yrkuTxKm86wu   2023年11月01日   100   0   0 AI综合

图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。传统图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。本文也是从这四点出发进行行文,以期了解传统图像识别技术、掌握hog特征提取和svm分类器。笔者的运行环境:python3.7+pycharm+opencv4.6,全文代码均可运行。 1.图像信息获取 简单理解就是把一幅图像转换成适合输入计算机和数字设备的数字信号。这需要要两个部件以获取数字图像: 物理设备,该设备对我们希望成像的物体发射的能量很敏感。 数字化设备,是一种把物理感知装置的输出转化为数字形式的设备。 常...

  yrkuTxKm86wu   2023年11月01日   88   0   0 AI综合

实战工具:python3.7+pycharm+opencv4.6算法知识:HOG特征提取、SVM模型构建实战目的:本次实战的目的是熟悉HOG+SVM工作流算法,初步掌握图像分类的传统算法。实战记录:本以为在学习原理、算法应用、动手实操后会很顺利的完全自主实现行人检测项目,但实战过程却差强人意,所以结果嘛就马马虎虎了。实战过程中所爆露出的不足有以下几点: 对opencv、numpy、python的基础知识掌握的不够全面、牢固; 对HOG算法的输出数据形式理解不深刻; 对SVM模型的相关参数、函数方法一知半解,特别是数据在svm中的作用、输出。 实战评价:虽然坎坎坷坷,但还过得去。 1.准备工...

  yrkuTxKm86wu   2023年11月01日   93   0   0 AI综合

传统目标分类器主要包括ViolaJonesDetector、HOGDetector、DPMDetector,本文主要介绍VJ检测器,在VJ检测器基础上发展出了Haar检测器,Haar检测器也是更为全面、使用更为广泛的检测器。ViolaJonesDetector是作为人脸检测器被Viola和Jones提出来的,后来RainerLienhart和JochenMaydt将这个检测器进行了扩展,opencv中的haar检测器就是以此为基础的。既然提到了人脸检测,那就简单了解一下相关内容吧。目前人脸检测的方法主要有两大类:基于知识和基于统计。 基于知识的方法:主要利用先验知识将人脸看作器官特征的组合,...

  yrkuTxKm86wu   2023年11月01日   30   0   0 AI综合

传统目标分类器主要包括ViolaJonesDetector、HOGDetector、DPMDetector,本文主要介绍HOGDetector与SVM分类器的组合实现行人检测。HOG(HistogramsofOrientedGradients:定向梯度直方图)是一种基于图像梯度的特征提取方法,被广泛应用于计算机视觉和机器学习领域。由NavneetDalal和BillTriggs在2005年提出。HOG特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子,是与SIFT、SURF、ORB属于同一类型的描述符。HOG不是基于颜色值而是基于梯度来计算直方图的,它通过计算和统计图像局部区域的梯...

  yrkuTxKm86wu   2023年11月01日   31   0   0 AI综合

利用深度学习进行目标检测的算法可分为两类:two-stage和one-stage。two-stage类的算法,是基于RegionProposal的,它包括R-CNN,FastR-CNN,FasterR-CNN;one-stage类的算法仅仅使用一个CNN网络直接预测不同目标的类别与位置,它包括YOLO系列算法、SSD算法。two-stage类算法精度高,但速度慢,one-stage类算法速度快,但精度不如two-stage。当然了,在它们也在吸取彼此之间的精华,进而提升改进自我。YOLO(YouOnlyLookOnce)凭借其实时性、不错的精度,在工业应用中发挥着巨大的作用,如无人驾驶、农作物...

  yrkuTxKm86wu   2023年11月01日   56   0   0 AI综合

YOLOv5是GlennJocher等人研发,它是Ultralytics公司的开源项目。YOLOv5根据参数量分为了n、s、m、l、x五种类型,其参数量依次上升,当然了其效果也是越来越好。从2020年6月发布至2022年11月已经更新了7个大版本,在v7版本中还添加了语义分割的功能。本文以YOLOv5_v6为媒介,对YOLOv5进行学习。 1.综述 先放上个人对YOLOv5_v6的理解(可结合图1进行阅读),这里我们假设对一组图片进行训练。首先我们要了解,YOLOv5_v6是对三个尺度的特征图进行目标检测的,即large(大)、medium(中)、small(小)三种。1)准备工作(Input...

  yrkuTxKm86wu   2023年11月01日   54   0   0 AI综合

笔者的运行环境:python3.8+pytorch2.0.1+pycharm+kaggle。yolov5对python和pytorch版本是有要求的,python>=3.8,pytorch>=1.6。yolov5共有5种类型n\s\l\m\x,参数量依次递增,对训练设备的要求也是递增。本文以yolov5_6s为切入点,探究yolov5如何在实战种运用。 1.数据集的准备 roboflow是一个公开数据集网站,里面有很多已经标注好的数据可以直接拿来练手,很方便。我们就以里面的车辆数据集为本次实战数据集,点击这里直接下载数据集。该数据集共有五个类别,['Ambulance','Bus'...

  yrkuTxKm86wu   2023年11月01日   110   0   0 AI综合

笔者的运行环境:python3.8+pytorch2.0.1+pycharm+kaggle用到的网络框架:yolov5、crnn+ctc项目地址:GitHubWangPengxing/plate_identification:利用yolov5、crnn+ctc进行车牌识别 1.写在开始之前 在学习过目标检测和字符识别后想用yolov5、crnn+ctc做一个车牌识别项目,本意是参考大佬们的项目,怎奈钱包不允许。网上有关车牌检测的基本都是引流贴,甚至有的连用到的公共数据集都不放链接,索性我也不找了,直接找原始数据集,从头开始搞。本文是一篇实战过程记录,仅记录我在车牌识别项目中的工作,不会牵涉...

  yrkuTxKm86wu   2023年11月01日   49   0   0 AI综合
关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~