麦粉社区
>
帖子详情

python学习篇-pandas库(一)

数据挖掘 发表于 2019-12-10 11:46
发表于 2019-12-10 11:46:21
本帖最后由 chenshuo 于 2019-12-10 14:07 编辑

Pandas 的数据结构:Pandas 主要有 Series(一维数组),DataFrame(二维数组),Panel(三维数组),Panel4D(四维数组),PanelND(更多维数组)等数据结构。其中 Series 和 DataFrame 应用的最为广泛

  • Series 是一维带标签的数组,它可以包含任何数据类型。包括整数,字符串,浮点数,Python 对象等。Series 可以通过标签来定位。
  • DataFrame 是二维的带标签的数据结构。我们可以通过标签来定位数据。这是 NumPy 所没有的。
创建Series数据类型
Series可以被看做由一列数据组成的数据集
创建Series语法:s = pd.Series(data,index=index)
下面介绍通过三种方式创建:
1、从列表创建Series
  1. arr = [0, 1, 2, 3, 4]
  2. s1 = pd.Series(arr)  # 如果不指定索引,则默认从 0 开始
  3. s1
复制代码

复制代码
829355def135bcebe9.png
提示:前面的 0, 1, 2, 3, 4 为当前 Series 的索引,后面的 0, 1, 2, 3, 4 为 Series 的值。
2、从Ndarray创建Series
  1. import numpy as np

  2. n = np.random.randn(5)  # 创建一个随机 Ndarray 数组
  3. index = ['a', 'b', 'c', 'd', 'e']
  4. s2 = pd.Series(n, index=index)
  5. s2
复制代码
870275def1410e9480.png
3、从字典中创建Series
  1. d = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}  # 定义示例字典
  2. s3 = pd.Series(d)
  3. s3
复制代码
820495def1471af8ab.png


高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 0关注人数 3895浏览人数
最后回复于:2019-12-10 11:46
快速回复 返回顶部 返回列表