十二月下旬内容焕新丨技能实战、智慧提效与生态拓展

年终冲刺,进步不停!十二月下旬新内容聚焦技能实战、智慧提效、场景解析与开发拓展,助你在数据与智能的浪潮中更进一步!

一、场景化课程上线完结

驱动增长:汽车制造营销分析主题课程→聚焦汽车行业营销场景,学习如何利用数据驱动业务增长。

价值引擎:汽车制造财务分析主题课程→深入财务数据分析,助力企业价值挖掘与决策支持。

二、场景应用上线

【漏斗图】漏斗洞察:三分钟,看透流程的每一步→ 快速掌握漏斗分析,优化业务流程效率。

模型篇:如何构建支撑AlChat的证券数据模型》→ 解析证券行业数据模型构建,赋能AI助手智能基础。

【地图】先导篇:一眼看透数据在空间中的故事→ 入门地图可视化,发现数据背后的地理逻辑。

【地图】区域地图:直观对比,掌控全局→ 学习区域地图制作,实现跨区域数据对比分析。

三、技术经验分享

乱码大作战:从“乱码地狱”到“数据天堂”的爆“效”指南》→ 攻克数据乱码难题,带你高效实现数据质量的跃升。

四、二次开发视频

扩展包开发知识点——知识库升级以及查询对象》→ 深化扩展包开发能力,学习知识库升级与查询对象优化。

五、任务持续上线

【图表应用】绘制漏斗图,诊断转化瓶颈→ 学习漏斗图绘制,精准定位业务流程中的转化短板。

AlChat入门闯关计划 - 第二关》→ 继续AI助手探索之旅,掌握更智能的对话交互技能。

【图表应用】测测你是否真的“看懂”地图?》→ 检验地图图表理解能力,提升空间数据解读水平。

【场景实战系列】即席查询,赢取278麦豆!》→ 实战演练即席查询,灵活获取所需数据。

【场景实战系列】透视分析,赢取278麦豆!》→ 掌握数据透视技巧,实现多维度业务洞察。

【图表应用】区域地图在手,业绩分布一目了然→ 借助区域地图,直观掌握业务区域表现。

BI知识闯关】乱码大作战:从“乱码地狱”到“数据天堂”的爆“效”指南》→ 通过闯关巩固乱码处理知识,学以致用。

【调研】社区内容调研,1分钟即可得100麦豆!》→为了未来能为您提供更精彩的内容和活动,我们想聆听您的真实心声

六、全新素材上线

HTTP API接口测试工具》→ 提供便捷的接口测试支持,助力开发调试更高效。

七、互动活动开启

2025年售后服务问卷调研有奖活动》→ 参与调研反馈,助力产品优化,更有机会赢取好礼。

麦粉社区
>
帖子详情

python学习篇-pandas库(五)

数据挖掘 发表于 2019-12-17 17:56
发表于 2019-12-17 17:56:53
DataFrame常用基本操作
创建数据集df2
  1. import pandas as pd
  2. import numpy as np
  3. data = {'animal': ['cat', 'cat', 'snake', 'dog', 'dog', 'cat', 'snake', 'cat', 'dog', 'dog'],
  4.         'age': [2.5, 3, 0.5, np.nan, 5, 2, 4.5, np.nan, 7, 3],
  5.         'visits': [1, 3, 2, 3, 2, 3, 1, 1, 2, 1],
  6.         'priority': ['yes', 'yes', 'no', 'yes', 'no', 'no', 'no', 'yes', 'no', 'no']}

  7. labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
  8. df2 = pd.DataFrame(data, index=labels)
复制代码
787865df891df29a53.png
1、预览数据
DataFrame.head(n):预览前n行数据
参数n为显示行数
  1. df2.head(3)
复制代码
390865df89327942dc.png
2、查看DataFrame的后3行数据
函数DataFrame.tail(n):预览后n行数据
参数n为显示行数

  1. df2.tail(3)
复制代码
656175df893a37fa1e.png
3、查看DataFrame索引
函数DataFrame.index
  1. df2.index
复制代码
228205df8940407287.png
4、查看DataFrame的列名
函数DataFrame.columns
  1. df2.columns
复制代码
913585df89474419d1.png
5、查看DataFrame的数值
函数DataFrame.values
  1. df2.values
复制代码
186275df894e5ee78f.png
6、查看DataFrame的统计数据
函数DataFrame.describe(include='all')
参数include:如果include='all',返回结果将包含各种类型的属性信息,比如字符串的唯一计数、出现次数、出现最多。
返回count:计数不包括nan值;mean:均值;std:方差;min:最小值;max:最大值
  1. df2.describe()
复制代码
217155df89586a312e.png
  1. df2.describe(include='all')
复制代码
217645df89a4db9615.png
7、DataFrame的转置
函数DataFrame.T
  1. df2.T
复制代码
412735df89aa50f454.png
8、对DataFrame进行排序
DataFrame.sort_values()
参数by:指定排序列名
参数ascending:指定排序方式,默认True,升序
参数na_position:指定NaN值位置,默认last
  1. df2.sort_values(by='age')  # 按 age 升序排列
复制代码
721575df89d0796629.png
  1. df2.sort_values(by='age',ascending=False,na_position='first')
复制代码
873045df89d25872cb.png
9、对DataFrame数据切片
  1. df2[1:3]
复制代码
928655df89d7724314.png
10、对DataFrame通过标签查询
单列
df2['age'] 等价于 df2.age   
  1. df2['age']
复制代码
951195df89e223d969.png
多列
  1. df2[['age', 'animal']]  # 传入一个列名组成的列表
复制代码
619715df89e8e45073.png
11、对DataFrame通过位置查询
  1. df2.iloc[1:3]  # 查询 2,3 行
复制代码
7905df89ed69f90d.png
12、对DataFrame拷贝
  1. df3 = df2.copy()# 生成 DataFrame 副本
  2. df3
复制代码
462995df89f20821ab.png
13、判断DataFrame元素是否为空
  1. df3.isnull()  # 如果为空则返回为 True
复制代码
116215df89f6c98eca.png
14、添加列数据
  1. num = pd.Series([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], index=df3.index)

  2. df3['Num'] = num  # 添加以 'Num' 为列名的新数据列
  3. df3
复制代码
892645df8a2e96d1ce.png
14、更改DataFrame对应的下标值
  1. # 修改第 2 行与第 2 列对应的值 3.0 → 2.0
  2. df3.iat[1, 1] = 2  # 索引序号从 0 开始,这里为 1, 1
  3. df3
复制代码
615355df8a36d6761f.png
15、根据索引列名更改DataFrame对应的值
  1. df3.loc['f', 'age'] = 1.5
  2. df3
复制代码
603265df8a41c324ed.png
发表于 2019-12-20 11:34:50
df2[['age', 'animal']]  # 传入一个列名组成的列表
应该会有警告了,提倡: df2.loc[:,["age","animal"]]
回复

使用道具 举报

发表于 2019-12-23 15:10:00
向南 发表于 2019-12-20 11:34
df2[['age', 'animal']]  # 传入一个列名组成的列表
应该会有警告了,提倡: df2.loc[:,["age","animal"] ...

可以的,很细节
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

2回帖数 0关注人数 7356浏览人数
最后回复于:2019-12-23 15:10
快速回复 返回顶部 返回列表