创建DataFrame数据类型
DataFrame可以存在多列数据,一般来说,更加常用。
创建DataFrame语法 df = pd.DataFrame(data, index=index, columns=columns)
参数
data:可以为ndarray,dict,DataFrame;
index:索引
columns:列名称
1、通过Numpy数组创建DataFrame:
- import pandas as pd
- import numpy as np
- dates = pd.date_range('today', periods=6) # 定义时间序列作为 index
- num_arr = np.random.randn(6, 4) # 传入 numpy 随机数组
- columns = ['A', 'B', 'C', 'D'] # 将列表作为列名
- df1 = pd.DataFrame(num_arr, index=dates, columns=columns)
- print(df1)
复制代码
2、通过字典数组创建DataFrame:
- data = {'animal': ['cat', 'cat', 'snake', 'dog', 'dog', 'cat', 'snake', 'cat', 'dog', 'dog'],
- 'age': [2.5, 3, 0.5, np.nan, 5, 2, 4.5, np.nan, 7, 3],
- 'visits': [1, 3, 2, 3, 2, 3, 1, 1, 2, 1],
- 'priority': ['yes', 'yes', 'no', 'yes', 'no', 'no', 'no', 'yes', 'no', 'no']}
- labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
- df2 = pd.DataFrame(data, index=labels)
- print(df2)
复制代码
3、查看DataFrame数据类型
|