一月初新内容速递丨数据管控、图表应用与函数启航

新年伊始,学习继续!一月上旬更新聚焦数据安全、图表实战、函数入门与场景深化,助你在数据智能的旅程中稳健开年!

一、技术经验分享

精细化管控数据导出,让敏感数据无处泄露!→加强数据安全管理,有效防止敏感信息外泄,提升企业数据合规性。

二、任务持续上线

【图表应用】散点图精准洞察分布→学习散点图制作与分析,掌握数据分布洞察技巧。
【函数】新手村试炼:计算度量入门挑战→函数入门实战,轻松攻克计算度量基础。
【图表应用】热力地图:看透市场浓度的战略眼→掌握热力地图绘制,直观识别市场热度分布。
BI知识闯关】精细化管控数据导出,让敏感数据无处泄露!》→巩固数据安全知识,提升管控实战能力。
【新年活动】年货采购数据侦探→结合新年主题,锻炼数据筛选与分析能力。

三、场景应用精选

价值引擎:汽车制造财务分析主题课程→延续财务数据分析实战,助力企业决策与价值挖掘。
【地图】散点地图:精确落位,洞察分布→学习散点地图应用,实现地理位置数据的可视化呈现。
【地图】热力地图:一眼识别业务“高地”与“洼地”》→掌握热力地图在业务分析中的实战应用。

四、二次开发视频更新

Excel导入模板扩展校验类》→深入学习Excel导入功能的扩展校验技术,提升数据导入的准确性与规范性。

五、活动进行中

新年第①弹|年货采购数据挑战:你能答对几题?》→趣味数据挑战赛,检验你的数据分析能力,赢取开年好礼。

六、官方通知发布

2025年度任务排行榜大揭晓!》→回顾2025年度学习成果,揭晓任务完成排行榜,激励持续学习。

七、函数应用入门

【函数课堂】函数总览篇:告别“不会用计算度量”的焦虑》→系统讲解函数使用,帮助你轻松入门计算度量,摆脱使用困惑。

麦粉社区
>
帖子详情

python学习篇-pandas库(九)

数据挖掘 发表于 2019-12-25 16:32
发表于 2019-12-25 16:32:45
插值法填补缺失值
函数DataFrame.interpolate()
参数method:默认linear
  • ‘linear’:忽略索引并将值视为等间距
  • index’, ‘values’:使用索引的实际数值
  • ‘pad’:用现有的数据填写NaN
  • ‘nearest’, ‘zero’, ‘slinear’, ‘quadratic’, ‘cubic’, ‘spline’, ‘barycentric’, ‘polynomial’:
      'polynomial'和'spline'都要求指定一个order(int)

参数limit:int,要填充的NaN值的最大个数,必须大于0
参数limit_direction:{‘forward’, ‘backward’, ‘both’}, default ‘forward’,如果指定了limit,则按此方向填充连续的NaN
1、Series通过linear方法填充NaN
  1. s = pd.Series([0, 2, np.nan, np.nan,8])
  2. print(s)
  3. s.interpolate(method='linear')
复制代码
524055e031678965a3.png
2、根据现有数据填充NaN
  1. s = pd.Series([0, 2, np.nan, np.nan,8,np.nan])
  2. print(s)
  3. s.interpolate(method='pad',limit=1)
复制代码
718705e03173cb49de.png
3、使用多项式方法填充
  1. s = pd.Series([0, 2, np.nan, np.nan,8,np.nan])
  2. print(s)
  3. s.interpolate(method='polynomial',order=2)
复制代码
506765e031b8ff322c.png
4、指点方向填充数值
  1. df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0),
  2. ...                    (np.nan, 2.0, np.nan, np.nan),
  3. ...                    (2.0, 3.0, np.nan, 9.0),
  4. ...                    (np.nan, 4.0, -4.0, 16.0)],
  5. ...                   columns=list('abcd'))
  6. print(df)
  7. df.interpolate(methmod='linear',limit_direction='backward',axis=0)
复制代码
321795e031d7118fea.png
5、对某一列作填充数值操作
  1. print(df['d'])
  2. df['d'].interpolate(method='polynomial',order=2)
复制代码
349635e031e7788e76.png
高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

0回帖数 0关注人数 6672浏览人数
最后回复于:2019-12-25 16:32
快速回复 返回顶部 返回列表