数据都可以转换成矩阵,行就是每一条样本数据,列是每个字段的特征,numpy在矩阵计算上非常高效,可以快速处理数据并进行数值计算
主要了解numpy核心的模块与常用的函数的使用方法
|
工号 |
职位 |
工龄 |
收入 |
张三 |
... |
... |
... |
|
李四 |
... |
... |
... |
|
王五 |
... |
|
... |
|
3.1 numpy的基本操作
在使用numpy工具包之前,必须先导入资源包
In import numpy as np
说明:as 给资源包 起别名的关键字,np 是numpy别名,np代表的就是numpy
3.1.1 array 数组
假设按照python的常规方法定义一个数组array=[1,2,3,4,5],并对数组中的每一个元素都执行+1的操作,
# 执行当前代码块的快捷键:ctrl+enter
# 执行当前代码块且插入一个输入行的快捷键:alt+enter
# 以上错误输出结果显示此处创建的是一个list结构,无法执行上述操作,不同格式的数据,执行操作后的结果也是不一样的,
以上输出结果显示数据类型是ndarray,也就是numpy中低层数据类型,后续进行各种矩阵操作的基本对象就是它
以上结果说明:在numpy中如果对数组执行一个四则运算(+-*/)就相当于对其中的每一个元素做相同的操作,如果数组操作的对象和它的规模一样,则其结果就是对应位置进行计算。
3.1.2 数组特性
以上结果表示当前数组是一维,其中有5个元素
holly_list=[1,2,3,4,5]
holly_list.shape
创建一个二维数组
np.array([ [1,2,3] , [4,5,6] ])