背景:Python做数据分析,DataFrame数据结构 由于需要根据历史的时间序列预测未来一段时间的序列值,在获取时间序列时经常会遇到部分值缺失,或者数值不理想的情况。此时为了保证历史序列的正确提取,就要把异常值去掉,然后通过插值进行修补。 以下是Pandas中的几种插值方式,使用方便: 1、线性插值。 顾名思义,可能是最直接的插值方式之一,虽然简单可能效果也不太好。 特点:只能在已知样本中间插值,像我的数据里,起始数据没有的情况是不行的。 代码很简单,Pandas的内置函数,把要插值的地方置为NaN,然后直接调用interpolate()函数。 delIndex=df[df['cloud...

  bF5iNti13xXC   2023年11月12日   50   0   0 插值Python时间序列

背景:一张图一张图看和下载太慢了,批量把网上的开放图源下载到本地,方便快捷。 方法:Python、requests库 首先,任意选择一个开源图片网站,这里随机选择了一个网站P站美图。 要实现自动化下载,首先肯定要人为分析下载的过程,再依靠代码让这个流程自动化。 观察网页,一张网页里包含多个帖子,点进去后才能看到该帖发布的所有图片,因此要下载所有的图片就需要至少两步: step1:访问页面里的帖子 step2:访问发帖里的图片 在我们访问图片时就能够获取图片的所有信息,包括图片的url地址,利用url就可以观看和下载图片了。 当然,除了第一页之外,还有第二、第三页,所以需要换页,因此还有一步:...

  bF5iNti13xXC   2023年11月02日   58   0   0 爬虫二次元批量下载Python
关注 更多

空空如也 ~ ~

粉丝 更多

空空如也 ~ ~