循环神经网络 —— LSTM 有状态模型（stateful LSTM）和无状态模型（stateless LSTM）-摩杜云开发者社区

循环神经网络 —— LSTM 有状态模型（stateful LSTM）和无状态模型（stateless LSTM）

z67waqH4oRtg 2023年11月30日 33 0

数据默认值默认值赋值数据赋值

相关参考：

训练后的LSTM模型在进行预测时的初始h_n和c_n是什么或应该怎么设置？

Keras中对RNN网络的statefull和stateless设置：

链接：https://keras.io/zh/getting-started/faq/#how-can-i-use-stateful-rnns

循环神经网络 —— LSTM 有状态模型（stateful LSTM）和无状态模型（stateless LSTM）_赋值

循环神经网络 —— LSTM 有状态模型（stateful LSTM）和无状态模型（stateless LSTM）_赋值_02

===============================================

必须要承认，由于平时很少用RNN，所以对于LSTM的stateful和stateless这两者的区别也是头一次听说。

首先我们要知道LSTM的初始值这个概念，LSTM在初始时框架一般默认对初始值h_0和c_0赋值为0，具体见pytorch官方文档：

https://pytorch.org/docs/stable/generated/torch.nn.LSTM.html#torch.nn.LSTM

知道了这个初始值的概念后我们可以知道LSTM在每个batch的训练和预测时都是会使用这个默认值的，也就是说每个batch时h_0和c_0都是被设置为0的，由于在LSTM这样的RNN网络中每个sample都是一个时序类型的数据，因此在一个batch的计算中每个sample在计算不同时间步时上一时间步计算得到的h_t和c_t会作为t+1步时的h_0和c_0的输入值，但是当每个batch计算结束后计算下个batch数据时默认都是将h_0和c_0默认赋值为0的。但是，有时候可能sample过长，我们可以把原本的一个sample切分成前后两个sample，也可能本身sample之间就具备时序关系，这时候在一个epoch中计算上下两个batch时如果将上一个batch计算结束时的h_0和c_0作为下个batch计算时的初始值会提升模型的性能，而这种方式的LSTM则被称为stateful，而默认的那种前后batch都将初始值设置为0的默认方式被称为stateless。

框架中使用staleful的LSTM时需要保证上下batch中batch_size是相同的，并且batch内的sample不能shuffle；而且要知道只有少数的情况，如前后batch的数据有时序关联的情况下才适合使用stateful的LSTM，否则适用于默认的stateless的LSTM。

===============================================

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：带有最小间隔时间的队列读取实现 —— 最小等待时间的队列 —— Python编程下一篇：加固数据安全：Java助力保护Excel文件，让数据无懈可击

分享：

最后一次编辑于 2023年11月30日 0

暂无评论

推荐阅读

Google PWA永久包领先者 | 【永不掉包】安卓应用代上架方案

google pwa 2024年04月23日 94 0 0 数据数据数据数据

静态代理IP是否支持HTTP和HTTPS？

Smartproxy 2024年05月06日 80 0 0 linux 数据 python 数据 Java linux 数据 python 数据

关于ISP解答

Smartproxy 2024年04月19日 56 0 0 linux 数据 java 数据 Java MySQL资讯 linux 数据数据

谷歌新增APP上架渠道: Google PWA，附带ROI增强功能，优于Google Play和APK方式，进入Google PWA是王道！

google pwa 2024年04月19日 100 0 0 数据数据数据数据

安卓上架永久包解决方案| 免审核，免抽佣，极速上架，google wpa让你一次搞定应用上架

google pwa 2024年04月16日 100 0 1 数据数据数据数据

新客户免费上架安卓pwa app永久包，google pwa让您的Android飞速上架！

google pwa 2024年04月15日 184 0 4 数据数据数据数据

海外APP上架不再难，新客户免费上架Google PWA APP永久包

google pwa 2024年04月22日 80 0 0 数据数据数据数据

高性价比的海外IP代理,-Smart Proxy

Smartproxy 2024年04月15日 217 0 2 linux 数据 python java 数据 Java linux 数据 python 数据

选择使用海外IP还是国外IP代理？海外动态住宅代理的使用规则

Smartproxy 2024年04月29日 58 0 0 linux 数据 python java 数据 Java linux 数据 python 数据

使用代理http时出现503服务不可用的原因是什么？

Smartproxy 2024年04月26日 74 0 0 linux 数据 java 数据 MySQL资讯 redis linux 数据数据

代理http中的代理池对于爬虫业务有多重要？

Smartproxy 25天前 77 0 0 数据 python java 数据 Java redis 数据 python 数据

代理IP速度变慢的原因是什么，要如何解决？

Smartproxy 2024年05月09日 120 0 0 linux 数据数据 linux 数据数据

Google PWA APP永久包，免审核，0佣金，谷歌app上架包成功！

google pwa 2024年04月17日 98 0 1 数据数据数据数据

建立HTTP代理IP池的技术和工具支持

Smartproxy 2024年05月09日 217 0 0 数据 java 数据 Java 数据数据

Google WPA APP上架永久包，极速pwa安装，免审核，0佣金，无下架风险！

google pwa 2024年04月18日 211 0 0 数据数据数据数据

选择使用海外IP还是国外IP代理？海外动态住宅代理的使用规则

Smartproxy 2024年04月17日 84 0 0 数据 java 数据数据数据

短效http代理ip和动态http代理有什么联系？

Smartproxy 2024年05月10日 114 0 0 linux 数据 python 数据 Java linux 数据 python 数据

选择使用海外IP还是国外IP代理？海外动态住宅代理的使用规则

Smartproxy 2024年04月18日 84 0 0 linux 数据 python 数据 Java linux 数据 python 数据

Socks5代理IP：保障跨境电商的网络安全

Smartproxy 2024年05月10日 120 0 0 数据 python java 数据 Java 信息系统数据 python 数据

多号管理为什么要用http代理中的独享IP代理服务？

Smartproxy 2024年04月29日 78 0 0 数据 python java 数据 Java 数据 python 数据

z67waqH4oRtg

作者其他文章更多

纪念：买了人生中第一个域名 —— 华为云平台上购买的第一个网络域名

2023-12-19

向日葵的平替：一款个人开发的远程工具——fastnat

2023-12-19

七牛云-存储区域代码：报错："statusCode": 400,"error": incorrect region, please use up-cn-east

2023-12-19

人类社会学：“重男轻女"思潮的比重，从多孩男女性别比角度思考

2023-12-12

开源机器学习版本的Github：Hugging Face

2023-12-12

Python网络连接request报错：OSError: [Errno 113] No route to host

2023-12-12

韩国网费比其他国家贵10倍？—— 因网费太高，直播平台 Twitch 宣布2024年2月退出韩国市场

2023-12-12

python报错：Pip 20.3+ break proxy connection

2023-12-12

生活记录：和大师姐及实验室师兄弟一起吃鸡公煲留念——集积分兑换“毛绒玩具小猪”

2023-12-12

OpenAI内讧更多细节曝光：奥特曼离间董事会失败

2023-12-12

最新推荐更多

终于搞懂了！原来 Vue 3 的 generate 是这样生成 render 函数的

2024-05-20

博客园美化：增加顶部炫彩loading进度条

2024-05-20

lodash已死？radash库方法介绍及源码解析 —— 函数柯里化 + Number篇

2024-05-20

TypeScript入门介绍

2024-05-20

XML Schema 复杂元素类型详解：定义及示例解析

2024-05-20

什么是单点登录？如何实现？

2024-05-20

基于uniapp+vue3自定义增强版table表格组件「兼容H5+小程序+App端」

2024-05-18

解释下什么是事件代理？应用场景？

2024-05-18

Vue项目中有封装过axios吗？主要是封装哪方面的？

2024-05-17

浅谈Vue.js与原生开发

2024-05-17

vue要做权限管理该怎么做？如果控制到按钮级别的权限怎么做？

2024-05-17

Vue模板语法、属性绑定、条件渲染的学习

2024-05-17

vue3编译优化之“静态提升”

2024-05-17

VUE-局部使用

2024-05-17

你是怎么处理vue项目中的错误的？

2024-05-17

实现抖音 “视频无限滑动“效果

2024-05-17

说说webpack proxy工作原理？为什么能解决跨域?

2024-05-17

我为什么还要造一个前端轮子？

2024-05-17

一款摸鱼神器！帮助你利用上班时间背单词！

2024-05-17

next-route

2024-05-17