时间序列插值-摩杜云开发者社区

时间序列插值

bF5iNti13xXC 2023年11月12日 49 0

插值 Python 时间序列

背景：Python 做数据分析，DataFrame数据结构

由于需要根据历史的时间序列预测未来一段时间的序列值，在获取时间序列时经常会遇到部分值缺失，或者数值不理想的情况。此时为了保证历史序列的正确提取，就要把异常值去掉，然后通过插值进行修补。

以下是Pandas中的几种插值方式，使用方便：

1、线性插值。

顾名思义，可能是最直接的插值方式之一，虽然简单可能效果也不太好。

特点：只能在已知样本中间插值，像我的数据里，起始数据没有的情况是不行的。

代码很简单，Pandas的内置函数，把要插值的地方置为NaN，然后直接调用interpolate()函数。

delIndex = df[df['cloud'] != 0].index # 筛选要插值的位置
df.iloc[delIndex, 2] = np.nan # 置为NaN
df = df.interpolate() # 插值

插值前：

时间序列插值_Python

线性插值后：

时间序列插值_Python_02

2、多项式插值也是一样，指定参数method和阶数order：

delIndex = df[df['cloud'] != 0].index # 筛选要插值的位置
df.iloc[delIndex, 2] = np.nan # 置为NaN
df = df.interpolate(method='polynomial', order=2) # 多项式插值

多项式插值后：

时间序列插值_插值_03

这段数据看起来多项式插值和线性插值区别不大，插值结果只有小数级的差异。

3、样条插值是一种基于样条曲线的插值方法。它通过拟合一条具有光滑特性的曲线来估算未知数据点的值。在Pandas中，可以使用interpolate()函数的method参数来选择样条插值的方法。

delIndex = df[df['cloud'] != 0].index # 筛选要插值的位置
df.iloc[delIndex, 2] = np.nan # 置为NaN
df = df.interpolate(method='spline', order=2) # 样条插值

样条插值后：

时间序列插值_时间序列_04

单看数值差异很小，猜测对我这个任务，使用哪种插值方法影响不大。

等我插值完所有的缺失数据后，计算一次总体误差应该能比较一下在这个任务上哪种插值方法更好，当然，也可能结果差距不大。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： Adobe Bridge(BR) 2023 下载及安装教程下一篇： [springMVC学习]12、异常处理

分享：

最后一次编辑于 2023年11月12日 0

暂无评论

推荐阅读

使用Python开发一个操作系统是一项复杂的任务，因为操作系统通常需

X5zJxoD00Cah 2023年12月12日 32 0 0 github Python .net

构建外卖系统：使用Django框架

XtDBRRsOBBHg 2023年12月09日 28 0 0 Django Python 服务器

在Python中，你可以使用`subprocess.run()`函数来运行一个外部命令，并获取其输出。你需要将`capture_output`参数设置为`True`，这样函数就会捕获标准输出和标准错误

X5zJxoD00Cah 2023年12月11日 40 0 0 极客 Python

在CMD中运行Python脚本时，如果出现中文乱码

X5zJxoD00Cah 2023年12月12日 42 0 0 中文乱码 Python 默认编码

在Python中，你可以通过定义一个类并在该类中实现`__iter__()`和`__next__()`方法来创建自己的迭代器¹²⁴。以下是一个示例¹²： ```python class MyNumb

X5zJxoD00Cah 2023年12月11日 30 0 0 github Python 迭代器

一次性消耗

X5zJxoD00Cah 2023年12月11日 27 0 0 知乎 Python 迭代器

在 Python 中，`def fun(var: str = "str")` 这样的语法被称为类型注解¹²³。类型注解的主要作用是为变量或函数参数提供预期的类型信息¹²³。这可以帮助开发者理解函数应该

X5zJxoD00Cah 2023年12月09日 32 0 0 知乎 Python

如何生成字典

X5zJxoD00Cah 2023年12月08日 54 0 0 数据类型 Python 键值对

你的代码中出现的错误`NameError: name '__file__' is not defined`表示Python无法找到`__file__`这个变量。`__file__`是一个特殊的变量，它

X5zJxoD00Cah 2023年12月12日 34 0 0 解决方案 Python

python中为什么0**0 是1 而 0**1 是0?

X5zJxoD00Cah 2023年12月12日 28 0 0 操作数 Python 运算符

通过cmd运行脚本输入变量输出变量

X5zJxoD00Cah 2023年12月12日 41 0 0 Python

定义函数的参数 nameerror

X5zJxoD00Cah 2023年12月07日 33 0 0 未定义 Python sed

在Python中，函数定义的参数列表中，带有默认值的参数（默认参数）必须位于没有默认值的参数（非默认参数）之后。这是因为当函数被调用时，Python会按照参数在列表中的顺序将传入的值赋给相应的参数。如

X5zJxoD00Cah 2023年12月08日 34 0 0 函数定义默认参数 Python

在Python中，字符串前的r和f可以一起使用

X5zJxoD00Cah 2023年12月08日 33 0 0 Python 字符串

在Python中，type()函数有两种用法

X5zJxoD00Cah 2023年12月08日 38 0 0 数据类型 Python 动态创建

python查看库版本

X5zJxoD00Cah 2023年12月12日 34 0 0 Python .net

pymssql访问数据库时报错20002

X5zJxoD00Cah 2023年12月12日 43 0 0 SQL Python bc

要安装特定版本的Python库，您可以使用pip命令并指定所需的版本。例如，如果您想安装特定版本的numpy，比如1.21.0，您可以使用以下命令： ```bash pip install nump

X5zJxoD00Cah 2023年12月12日 33 0 0 Python 安装过程版本号

python 输出df 到 cyc 不行需要转list

X5zJxoD00Cah 2023年12月11日 29 0 0 Python

在Python中，`if`语句中的多条件`or`判断是有先后顺序的³⁵。Python会从左到右依次评估`or`表达式中的每个条件³⁵。如果在评估过程中，遇到了第一个为`True`的条件，那么Pytho

X5zJxoD00Cah 2023年12月06日 29 0 0 知乎 Python

bF5iNti13xXC

作者其他文章更多

时间序列插值

2023-11-12

Python批量下载图片

2023-11-02

最新推荐更多

Hexo发布管理工具

2024-03-28

GitLab (v16.x) 简述及安装部署

2024-03-13

开源无代码 / 低代码平台 NocoBase 0.20：支持多数据源

2024-03-11

易6画 - 在线海报ppt制作平台

2024-03-02

解读平台工程，DevOps真的死了吗？不，它只是换了个马甲而已，弥补了DevOps空心理论，让DevOps继续发展壮大

2024-02-27

Docker

2024-02-27

mdbook安装使用实录

2024-02-22

【更新公告】AirtestIDE更新至1.2.17版本

2024-02-22

在线图片生成工具：定制化占位图片的利器

2024-02-20

1、Git简介

2024-02-19

发布、部署，傻傻分不清楚？从概念到实际场景，再到工具应用，一篇文章让你彻底搞清楚

2024-02-19

2、Git之Windows版本的安装

2024-02-19

使用Git向Gitee仓库推送项目的完整流程

2024-02-19

测试

2024-01-22

[【stars-one】Android图标生成器 PC工具

2024-01-21

ai文章创作助手，大模型原创助手，已对接rpcms

2024-01-15

如何写好技术文档 - 排版格式和规范(一)

2024-01-12

还在用Jekins？快来试试这款比Jekins简而轻的自动部署软件！

2023-12-29

绿色Windows版gvim

2023-12-29

Golang实现JAVA虚拟机-运行时数据区

2023-12-25