为什么 L1 正则化能做特征选择而 L2 正则化不能-摩杜云开发者社区

为什么 L1 正则化能做特征选择而 L2 正则化不能

582TtX3TNojB 2023年11月01日 54 0

AI综合

假设我们的模型只有一个参数 \(w\)，损失函数为 \(L(w)\)，加入 L1 和 L2 正则化后的损失函数分别记为 \(J_1(w), J_2(w)\)：

\[\begin{gathered} J_1(w) = L(w) + \lambda |w| \\ J_2(w) = L(w) + \lambda w^2 \end{gathered} \]

原损失函数 \(L\) 在 \(w = 0\) 处的导数记为 \(L'(0)\)，那么 \(J_1\) 在 \(w = 0\) 处的左、右导数为：

\[\begin{gathered} J_{-}'(0) = L'(0) - \lambda \\ J_{+}'(0) = L'(0) + \lambda \\ \end{gathered} \]

当 \(\lambda > |L'(0)|\) 时，\(w = 0\) 处的左导数 \(L'(0) - \lambda < 0\)、右导数 \(L'(0) + \lambda > 0\)，此时 \(w = 0\) 为 \(J_1\) 的一个极小值点。

也就是说，即使 \(L\) 不在 \(w = 0\) 处取得极小值（\(L'(0) \neq 0\)），我们也能够通过调节 \(\lambda\) 将损失函数的极小值点“转移”到 \(w = 0\)。

再来看 L2 正则化时的情况，\(J_2\) 在 \(w = 0\) 处的导数为：

\[J_2'(0) = [L'(w) + 2 \lambda w]_{w = 0} = L'(0) \]

由此可见，如果 \(L\) 不在 \(w = 0\) 处取得极小值（\(L'(0) \neq 0\)），那么加入 L2 正则项后仍然不可能在 \(w = 0\) 处取得极小值。

总结：L1 正则化能将损失函数的极小值点“转移”到 \(w = 0\) 处，而 L2 正则化无论如何设置 \(\lambda\) 都达不到这样的效果。

相关资料：

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：【自动驾驶100问】第一问到第三问下一篇：遗传算法求TSP问题

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

第六届·2024 MindSpore 量子计算黑客松热身赛赛题解读

YqbaJkf98QJO 2024年05月17日 73 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记24_预测性文本生成器

BD8Mqa3Ktdyv 2024年05月17日 43 0 0 AI综合

读人工智能时代与人类未来笔记01_重塑人类社会秩序

BD8Mqa3Ktdyv 2024年05月17日 37 0 0 AI综合

RustDesk 自建服务器部署和使用教程

166Ve614hKdJ 2024年05月17日 44 0 0 AI综合

读人工智能时代与人类未来笔记08_全球网络平台

BD8Mqa3Ktdyv 2024年05月20日 35 0 0 AI综合

用ChatGPT-4生成三体世界中的著名场景

oaRbYQvpZaaT 2024年05月20日 44 0 0 AI综合

全民AI的时代，如何创建一个属于自己的AI机器人

oaRbYQvpZaaT 2024年05月20日 52 0 0 AI综合

PaliGemma 正式发布 — Google 最新发布的前沿开放视觉语言模型

QKcLjRV1cZqV 2024年05月18日 51 0 0 AI综合

读人工智能时代与人类未来笔记06_机器学习的力量

BD8Mqa3Ktdyv 2024年05月18日 68 0 0 AI综合

开源RAG框架汇总

yCJS27XXARYK 2024年05月17日 62 0 0 AI综合

AI已来，我与AI一起用Python编写了一个消消乐小游戏

CCMY6VB0yzoR 2024年05月17日 67 0 0 AI综合

InLine Chat功能优化对标Github Copilot，CodeGeeX带来更高效、更直观的编程体验！

aEHR1Z2tWTaD 2024年05月17日 46 0 0 AI综合

OpenVoiceV2本地部署教程,苹果MacOs部署流程,声音响度统一,文字转语音,TTS

xvI3oTgzRc2D 2024年05月17日 63 0 0 AI综合

读人工智能时代与人类未来笔记07_人工智能往何处去

BD8Mqa3Ktdyv 2024年05月20日 45 0 0 AI综合

读人工智能时代与人类未来笔记03_演变

BD8Mqa3Ktdyv 2024年05月17日 33 0 0 AI综合

Photoshop AI生成式填充工具，PS AI怎么用，怎么注册升级PS AI账号？

En07e7YvOk1U 2024年05月17日 60 0 0 AI综合

读人工智能时代与人类未来笔记02_技术变革

BD8Mqa3Ktdyv 2024年05月17日 48 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记23_人工智能讲故事

BD8Mqa3Ktdyv 2024年05月17日 61 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记22_中文房间

BD8Mqa3Ktdyv 2024年05月17日 43 0 0 AI综合

AI 一键生成高清短视频，视频 UP 主们卷起来...

166Ve614hKdJ 2024年05月17日 39 0 0 AI综合

582TtX3TNojB

作者其他文章更多

std::format 如何实现编译期格式检查

2024-04-08

三门问题与贝叶斯公式

2023-12-22

让 MSYS2 Bash 像 Git Bash 一样显示 Git 分支名称

2023-11-01

为什么 L1 正则化能做特征选择而 L2 正则化不能

2023-11-01

变分自编码器（VAE）公式推导

2023-11-01

最新推荐更多

聊聊大模型的屏蔽词工程

2024-04-16

深度学习基本概念简介

2024-04-16

读天才与算法：人脑与AI的数学思维笔记01_洛夫莱斯测试

2024-04-16

RAG算法优化+新增代码仓库支持，CodeGeeX的@repo功能效果提升

2024-04-16

机器学习基本概念简介

2024-04-15

GPT连问工具随想

2024-04-15

读所罗门的密码笔记20_更好的自己

2024-04-15

Pytorch DistributedDataParallel（DDP）教程一：快速入门理论篇

2024-04-15

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

2024-04-15

向量数据库之Lancedb学习记录

2024-04-15

读所罗门的密码笔记19_治理模式

2024-04-14

解密prompt系列27. LLM对齐经验之如何降低通用能力损失

2024-04-13

读所罗门的密码笔记18_大宪章

2024-04-13

向量数据库Chroma学习记录

2024-04-13

最全能的AI换脸软件，FaceFusion下载介绍（可直播）

2024-04-13

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

2024-04-12

读所罗门的密码笔记17_网络安全

2024-04-12

基于香橙派AIpro将开源框架模型转换为昇腾模型

2024-04-12

元启发式算法库 MEALPY 初体验-遗传算法为例

2024-04-11

读所罗门的密码笔记16_直通心智

2024-04-11