要掌握 pandas,首先得了解它的两大主要数据结构: Series 和 DataFrame .

边学边整理~

Series

Series 是一种类似于一维数组的对象,它由一组数据以及与这组数据相对应的索引组成。

此处输入图片的描述

我们可以通过 Series 的 values 和 index 属性获取数组值索引

此处输入图片的描述

上面的索引是默认的,实际上我们可以进行自定义:

此处输入图片的描述

可以通过索引的方式选择 Series 中的单个值或一组值。另外,我们可以将 Series 看成是一个定长的有序字典,因为它是索引值到数据值的一个映射。如果数据被存放在 Python 字典中,我们可以直接通过这个字典来创建 Series。

Series 对象和它的 index 都含有一个 name 属性:

>>> s = Series(data=[1,3,5,7],index = ['a','b','x','y'])
>>> s
a    1
b    3
x    5
y    7
dtype: int64
>>> s.index
Index(['a', 'b', 'x', 'y'], dtype='object')
>>> s.values
array([1, 3, 5, 7], dtype=int64)