神经网络训练中的欠拟合、过拟合问题

PfEVswrG0sbF 2024年01月14日 17 0

机器学习

神经网络训练中的问题

神经网络在数据之海中打捞规律，自成模型。这个过程全权由电脑完成，也因此我们担心它是否是一种泛化的模式，在其它「海域」继续工作时，它能否也能得到正确的结果？如何发现 可以泛化的模式 是机器学习的根本问题。

过拟合与欠拟合

我们的数据通常分成3份：

训练数据：用于神经网络训练的数据；
测试数据：神经网络训练完后，用于评估其准确度的数据；
验证数据：为了确定候选模型中的最佳模型所用的检验数据。

在实际训练中，会有 欠拟合 和 过拟合 的情况。我们将神经网络用训练数据计算时的误差称为「训练误差」，用测试数据计算时的误差称为「泛化误差」。那么：

当训练误差与泛化误差都很大时，称模型「欠拟合」。由于训练误差大，所以也称该模型有「高偏差」问题；
当训练误差很小，但泛化误差很大时，称模型「过拟合」。由于泛化误差大，所以也称该模型有「高方差」问题。

模型选取

在机器学习中，我们通常从几个候选模型后选择最终的模型。例如，训练多层感知机时，我们会⽐较有着不同隐藏层数、每层有着不同数量神经元以及使用不同激活函数的模型。

当神经网络「欠拟合」时，我们首先可以让它训练更长一段时间，如果仍无效，则会考虑使用更复杂的神经网络（更多隐藏层、增加层的神经元、换其它激活函数等）或者使用其它类型的神经网络。

数据集大小

在如今有大量数据（百万甚至更大）的情况下，训练数据的比重可以占得很大：训/测/验 = 98%/1%/1% 即便是1%的数据也有上万，足以用于检验了，我们可以将更多数据投入训练中。

训练数据集的大小对模型训练结果有什么影响？训练集样本过少，可能会导致严重的「过拟合」问题，反过来说，更多的训练数据能减小泛化误差，而且通常没有坏处（除了训练久一点），尤其是训练复杂的模型时。

在尝试了更多数据后，如果模型仍「过拟合」或者你原本的数据已经是高质量的了，无法再获得更多数据时，则可以考虑 正则化 ，或者换用其它类型的神经网络。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： Text Intelligence - TextIn.com AI时代下的智能文档识别、处理、转换下一篇：【scikit-learn基础】--『监督学习』之均值聚类

分享：

最后一次编辑于 2024年01月14日 0

暂无评论

推荐阅读

3D Object Detection Essay Reading 2024.04.01

dJ3D4l50B9UA 2024年04月03日 56 0 0 机器学习

机器学习——常见模型评估指标

iucZlS7R5SPb 2024年04月10日 53 0 0 机器学习

理论+实践，带你了解分布式训练

YqbaJkf98QJO 6天前 22 0 0 机器学习

EM

YS70eVTgu2rK 6天前 15 0 0 机器学习

神经网络极简入门

6m3lfiEqOqHp 6天前 15 0 0 机器学习

机器学习基本概念简介

U1DtjyPMNAWc 29天前 36 0 0 机器学习

Simple Neural Network

YS70eVTgu2rK 16天前 17 0 0 机器学习

3D Object Detection Essay Reading 2024.04.05

dJ3D4l50B9UA 2024年04月05日 46 0 0 机器学习

物联网浏览器(IoTBrowser)-整合机器学习yolo框架实现车牌识别

F8jJ03o9PsK7 26天前 12 0 0 机器学习

深度学习基本概念简介

U1DtjyPMNAWc 28天前 36 0 0 机器学习

3D Object Detection Essay Reading 2024.03.27

dJ3D4l50B9UA 2024年03月28日 41 0 0 机器学习

机器学习&深度学习操作tips

7B6SM42ujHWs 2024年04月09日 38 0 0 机器学习

从模型到部署，教你如何用Python构建机器学习API服务

YqbaJkf98QJO 2024年04月08日 34 0 0 机器学习

如何实现最基础的动态网络局部社区演化

8buQ2bYmGTNf 2024年03月29日 46 0 0 机器学习

HMM

YS70eVTgu2rK 6天前 15 0 0 机器学习

元启发式算法库 MEALPY 初体验-遗传算法为例

n8Wj8MJ7GhFb 2024年04月11日 46 0 0 机器学习

（一）文本分类经典模型之CNN篇

mt1KYCtnH388 6天前 19 0 0 机器学习

概率图模型基础

YS70eVTgu2rK 6天前 17 0 0 机器学习

基于深度学习的图书管理推荐系统（附python代码）

mFHMZYoxrMdE 2024年03月31日 32 0 0 机器学习

搭建一个简易的 PMML 模型测试环境

6pDvxrZK9nwn 22天前 19 0 0 机器学习

PfEVswrG0sbF

作者其他文章更多

无模型的强化学习方法

2024-03-09

求解MDP最优策略——动态规划（笔记）

2024-03-08

「马尔可夫决策过程」学习笔记

2024-03-05

A星搜索算法的更多细节

2024-02-27

游戏AI LOD交易员（附项目）

2024-02-19

神经网络训练中的欠拟合、过拟合问题

2024-01-14

最新推荐更多

聊聊大模型的屏蔽词工程

2024-04-16

深度学习基本概念简介

2024-04-16

读天才与算法：人脑与AI的数学思维笔记01_洛夫莱斯测试

2024-04-16

RAG算法优化+新增代码仓库支持，CodeGeeX的@repo功能效果提升

2024-04-16

机器学习基本概念简介

2024-04-15

GPT连问工具随想

2024-04-15

读所罗门的密码笔记20_更好的自己

2024-04-15

Pytorch DistributedDataParallel（DDP）教程一：快速入门理论篇

2024-04-15

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

2024-04-15

向量数据库之Lancedb学习记录

2024-04-15

读所罗门的密码笔记19_治理模式

2024-04-14

解密prompt系列27. LLM对齐经验之如何降低通用能力损失

2024-04-13

读所罗门的密码笔记18_大宪章

2024-04-13

向量数据库Chroma学习记录

2024-04-13

最全能的AI换脸软件，FaceFusion下载介绍（可直播）

2024-04-13

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

2024-04-12

读所罗门的密码笔记17_网络安全

2024-04-12

基于香橙派AIpro将开源框架模型转换为昇腾模型

2024-04-12

元启发式算法库 MEALPY 初体验-遗传算法为例

2024-04-11

读所罗门的密码笔记16_直通心智

2024-04-11