九月上旬更新速递丨 AI赋能、技术实战与智能探索

AI浪潮席卷,九月更新携智能发布会、实战经验与开发进阶强势登场!助您紧跟技术前沿,玩转数据智能!

重点推荐AI发布会火热预热!Agent BI是什么?Smartbi AIChat 全新升级发布会为您揭晓!

现有预热活动【智能体降临,未来已来!】解锁Smartbi AIChat V4超能力,参与即有机会赢专属好礼,抢先体验AI新纪元!更推出全新《十分钟完整体验AIchat》课程视频,仅需10分钟,即可使用本地数据快速体验AIChat全部功能,轻松入门智能分析!

一、任务持续上线

特征工程和数据预处理有什么区别?强化记忆,巩固学习成果。
SmartBI玩转Top N分析,轻松揪出数据》→检验分析能力,突破业务洞察瓶颈。

二、实战技巧分享

SmartBI同比环比分析大揭秘:让数据“笑”出真相!》→让数据不再沉闷,让趋势跃然纸上!

SmartBI玩转Top N分析,轻松揪出数据"尖子生"!》→面对海量数据,如何高效地提取最有价值的信息,快速识别关键数据项

、开发技能突破

扩展包简介→通过了解扩展包的实现原理和作用,让我们对扩展包有大致的认知。

四、AI每日一学

LLM 中的 Token 和 Embedding 到底是啥?》→深入浅出解析自然语言处理中的基础概念,夯实AI理解基石。

特征工程和数据预处理有什么区别?→厘清特征处理与数据清洗的边界,为模型训练铺平道路。

注意力机制、自注意力机制、多头注意力揭秘Transformer核心机制,助力理解现代AI模型架构。


为进一步提升认证服务的质量与体验,我们对认证业务进行全面优化升级。更多详情请看→Smartbi认证考试优化升级公告



麦粉社区
>
帖子详情

python学习篇-pandas库(九)

数据挖掘 发表于 2019-12-25 16:32
发表于 2019-12-25 16:32:45
插值法填补缺失值
函数DataFrame.interpolate()
参数method:默认linear
  • ‘linear’:忽略索引并将值视为等间距
  • index’, ‘values’:使用索引的实际数值
  • ‘pad’:用现有的数据填写NaN
  • ‘nearest’, ‘zero’, ‘slinear’, ‘quadratic’, ‘cubic’, ‘spline’, ‘barycentric’, ‘polynomial’:
      'polynomial'和'spline'都要求指定一个order(int)

参数limit:int,要填充的NaN值的最大个数,必须大于0
参数limit_direction:{‘forward’, ‘backward’, ‘both’}, default ‘forward’,如果指定了limit,则按此方向填充连续的NaN
1、Series通过linear方法填充NaN
  1. s = pd.Series([0, 2, np.nan, np.nan,8])
  2. print(s)
  3. s.interpolate(method='linear')
复制代码
524055e031678965a3.png
2、根据现有数据填充NaN
  1. s = pd.Series([0, 2, np.nan, np.nan,8,np.nan])
  2. print(s)
  3. s.interpolate(method='pad',limit=1)
复制代码
718705e03173cb49de.png
3、使用多项式方法填充
  1. s = pd.Series([0, 2, np.nan, np.nan,8,np.nan])
  2. print(s)
  3. s.interpolate(method='polynomial',order=2)
复制代码
506765e031b8ff322c.png
4、指点方向填充数值
  1. df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0),
  2. ...                    (np.nan, 2.0, np.nan, np.nan),
  3. ...                    (2.0, 3.0, np.nan, 9.0),
  4. ...                    (np.nan, 4.0, -4.0, 16.0)],
  5. ...                   columns=list('abcd'))
  6. print(df)
  7. df.interpolate(methmod='linear',limit_direction='backward',axis=0)
复制代码
321795e031d7118fea.png
5、对某一列作填充数值操作
  1. print(df['d'])
  2. df['d'].interpolate(method='polynomial',order=2)
复制代码
349635e031e7788e76.png
高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 0关注人数 6258浏览人数
最后回复于:2019-12-25 16:32
快速回复 返回顶部 返回列表