软件测试|数据分析神器pandas教程(二)
  X7HGjGJ7MG9G 2023年11月02日 41 0

软件测试|数据分析神器pandas教程(二)_ci


前言

上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。

数据结构-Series

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)
  • index:数据索引标签,如果不指定,默认从 0 开始
  • dtype:数据类型,默认会自己判断
  • name:设置名称
  • copy:拷贝数据,默认为 False

创建一个简单的 Series 实例:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)

print(mydata)
----------------------
输出内容如下:
0    4
1    5
2    6
dtype: int64

从上可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据代码如下:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)


print(mydata[1])
----------------------------
输出结果如下:
5

我们也可以指定索引值,这样就可以按照索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata)

---------------------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

同样,我们也可以根据指定的索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata["city"])

-----------------------
输出结果如下:
Ganzhou

类似字典方法,通过键值对对象创建Series,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place)

print(mydata)
---------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

从输出结果可以得知,字典的键成为了索引,如果我们需要字典中的一部分数据,只需要指定需要数据的索引即可,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'])

print(mydata)

----------------------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
dtype: object

我们同样可以设置 Series 名称参数,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'], name="my hometown")

print(mydata)
--------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
Name: my hometown, dtype: object

总结

本文主要介绍了pandas的Series数据结构,这个数据结构较为简单,后续我们将介绍dataframe数据结构。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  SBowDWXjb0NT   2023年11月30日   40   0   0 redis线程池数据
X7HGjGJ7MG9G
最新推荐 更多