二月初新内容速递丨磁盘清理、图表进阶与AI探索

新春二月,学习正酣!二月上旬更新聚焦磁盘清理、图表进阶、场景深化与AI探索,助你在数据智能的道路上驰骋前行!

一、场景应用精选

酱油的数字化呼吸:当千年技艺遇上数据分析》→探索传统工艺与数据分析结合,领略数字化赋能案例。
【联合图】你的业务“双视角侦察机”使用指南》→学习联合图实战应用,提升业务分析效率。

二、二次开发视频更新

(5-2)扩展包开发知识点——知识库升级以及查询对象》→深入学习扩展包开发,掌握知识库升级与查询对象技术。

三、技术经验分享

Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→学习磁盘空间清理方法,释放存储资源,优化系统性能。

四、AI每日一学

【AI每日一学】讲一下MCP的三个场景及优势与局限性》→每日一学AI知识,快速掌握MCP的核心要点。

五、新年活动进行中

新年第③弹 | 新春祝福驰骋:马上送祝福,立马领麦豆!》→参与新春祝福活动,赢取麦豆奖励,开启新年好运。

六、任务持续上线

【BI知识闯关】Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→通过知识闯关巩固磁盘清理技巧,提升运维能力。
【行业场景】制曲环节合格率诊断实战》→深入制曲生产场景,学习合格率诊断分析方法,助力质量提升。
【图表应用】驾驭“联合图”,成为业务的双视角指挥官》→掌握联合图使用技巧,实现业务数据的多维度洞察。
【AI知识巩固】讲一下MCP的三个场景及优势与局限性》→巩固AI知识,了解MCP的典型场景及其优缺点。


磁盘清理释放空间,联合图表洞察双维,AI探索拓展认知——二月上旬,与数据共赴新春新征程!

麦粉社区
>
帖子详情

python学习篇-pandas库(九)

数据挖掘 发表于 2019-12-25 16:32
发表于 2019-12-25 16:32:45
插值法填补缺失值
函数DataFrame.interpolate()
参数method:默认linear
  • ‘linear’:忽略索引并将值视为等间距
  • index’, ‘values’:使用索引的实际数值
  • ‘pad’:用现有的数据填写NaN
  • ‘nearest’, ‘zero’, ‘slinear’, ‘quadratic’, ‘cubic’, ‘spline’, ‘barycentric’, ‘polynomial’:
      'polynomial'和'spline'都要求指定一个order(int)

参数limit:int,要填充的NaN值的最大个数,必须大于0
参数limit_direction:{‘forward’, ‘backward’, ‘both’}, default ‘forward’,如果指定了limit,则按此方向填充连续的NaN
1、Series通过linear方法填充NaN
  1. s = pd.Series([0, 2, np.nan, np.nan,8])
  2. print(s)
  3. s.interpolate(method='linear')
复制代码
524055e031678965a3.png
2、根据现有数据填充NaN
  1. s = pd.Series([0, 2, np.nan, np.nan,8,np.nan])
  2. print(s)
  3. s.interpolate(method='pad',limit=1)
复制代码
718705e03173cb49de.png
3、使用多项式方法填充
  1. s = pd.Series([0, 2, np.nan, np.nan,8,np.nan])
  2. print(s)
  3. s.interpolate(method='polynomial',order=2)
复制代码
506765e031b8ff322c.png
4、指点方向填充数值
  1. df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0),
  2. ...                    (np.nan, 2.0, np.nan, np.nan),
  3. ...                    (2.0, 3.0, np.nan, 9.0),
  4. ...                    (np.nan, 4.0, -4.0, 16.0)],
  5. ...                   columns=list('abcd'))
  6. print(df)
  7. df.interpolate(methmod='linear',limit_direction='backward',axis=0)
复制代码
321795e031d7118fea.png
5、对某一列作填充数值操作
  1. print(df['d'])
  2. df['d'].interpolate(method='polynomial',order=2)
复制代码
349635e031e7788e76.png
高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

0回帖数 0关注人数 6775浏览人数
最后回复于:2019-12-25 16:32

社区

指南

快速回复 返回顶部 返回列表