二月内容合辑丨磁盘清理、图表进阶与AI探索

新春二月,学习正酣!二月更新聚焦磁盘清理、图表进阶、场景深化与AI探索,助你在数据智能的道路上驰骋前行!

一、场景应用精选

酱油的数字化呼吸:当千年技艺遇上数据分析》→探索传统工艺与数据分析结合,领略数字化赋能案例。
【联合图】你的业务“双视角侦察机”使用指南》→学习联合图实战应用,提升业务分析效率。

【瀑布图】财务的“瀑布流水账”,一眼看穿数字背后的故事》——用瀑布图拆解财务数据流转,洞悉每一笔增减的来龙去脉。

【函数】Exclude函数:你的数据分析“一键清屏”神器!》——掌握Exclude函数用法,轻松排除干扰数据,聚焦关键信息。

二、二次开发视频更新

(5-2)扩展包开发知识点——知识库升级以及查询对象》→深入学习扩展包开发,掌握知识库升级与查询对象技术。

三、技术经验分享

Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→学习磁盘空间清理方法,释放存储资源,优化系统性能。

四、AI每日一学

【AI每日一学】讲一下MCP的三个场景及优势与局限性》→每日一学AI知识,快速掌握MCP的核心要点。

五、新年活动进行中

新年第③弹 | 新春祝福驰骋:马上送祝福,立马领麦豆!》→参与新春祝福活动,赢取麦豆奖励,开启新年好运。

六、任务持续上线

【BI知识闯关】Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→通过知识闯关巩固磁盘清理技巧,提升运维能力。
【行业场景】制曲环节合格率诊断实战》→深入制曲生产场景,学习合格率诊断分析方法,助力质量提升。
【图表应用】驾驭“联合图”,成为业务的双视角指挥官》→掌握联合图使用技巧,实现业务数据的多维度洞察。
【AI知识巩固】讲一下MCP的三个场景及优势与局限性》→巩固AI知识,了解MCP的典型场景及其优缺点。

【图表应用】瀑布图一眼看穿数字背后的故事》——实战演练瀑布图,让财务、库存等流水数据一目了然。
【函数】Exclude函数实战任务》——通过任务实战,熟练运用Exclude函数进行数据筛选与分析。

磁盘清理释放空间,联合图表洞察双维,Exclude函数精准筛选,AI探索拓展认知——二月合辑,与数据共赴新春新征程!

麦粉社区
>
帖子详情

[AIChat] 【AI每日一学】简单的介绍一下数据增强、特征工程、特征选择

动态中心 发表于 2025-8-4 11:09
发表于 2025-8-4 11:09:32

麦粉集合!AI实战落地系列第十九弹极速启航!


        上回我们深入探索了智能体新星 Manus 的四大核心优势,见识了它在任务执行、技术架构、用户体验和应用场景上的突破性表现!而今天,我们将回归模型训练的基石环节,聚焦数据预处理与特征处理的关键技术——数据增强、特征工程、特征选择,为模型打造更强大的"数据燃料库"!


         温故而知新,我们来做个知识巩固小测试,一周内答对的前三名麦粉奖励 20麦豆!答案藏在上期神帖【Manus与其他AI智能体产品有什么区别?】中~


AI知识问答(知识巩固)


1、Manus的任务执行能力与传统AI智能体的本质区别是什么?


A. 仅提供任务建议,需用户手动操作


B. 端到端独立完成多步骤复杂任务(如生成带地图的旅行手册)


C. 专注于单一领域的简单指令响应


D. 依赖实时交互才能执行基础操作


2、Manus的多智能体协同架构的核心价值是?


A. 使用单一模型处理所有任务


B. 将复杂任务分解为子任务,动态调用工具链并支持实时调整


C. 仅支持文本生成与信息检索


D. 任务中断后必须重新开始执行


3、Manus在用户体验上的突破性设计是?


A. 要求用户全程监控任务进程


B. 任务中断后自动丢弃进度


C. 云端异步执行、中途可修改需求、记忆用户偏好持续优化


D. 仅支持基础交互,无法适应个性化需求


 


        在领略了智能体的卓越能力后,我们自然要将目光转向支撑这些智能应用的核心技术——数据预处理与特征处理。这三项技术如同为模型打造强大的'数据燃料库',让我们去逐层解析:


简单的介绍一下数据增强、特征工程、特征选择(今日学习)


以下是对数据增强、特征工程、特征选择的简单介绍:


数据增强


数据增强是一种通过对原始数据进行一系列变换来增加数据量和多样性的技术。



  • 常见的方法:包括对图像进行旋转、翻转、缩放、裁剪、添加噪声等,对文本进行同义词替换、随机插入或删除单词等。

  • 目的:让模型在更多不同的样本上进行训练,从而提高模型的泛化能力,减少过拟合现象,使模型能够更好地应对各种实际情况。


 


特征工程


特征工程是将原始数据转化为更能被模型有效利用的特征的过程。它包括多个方面,如



  • 特征提取:即从原始数据中提取有代表性的特征,像从图像中提取纹理、颜色等特征;

  • 特征转换:对特征进行数学变换,如标准化、归一化等,使数据具有更好的分布特性;

  • 特征构建:根据业务知识和数据特点创建新的特征,比如根据用户的行为数据构建用户活跃度等特征。


特征工程的好坏直接影响模型的性能和效果。


 


特征选择


特征选择是从原始特征集中挑选出对模型目标最有价值的特征子集的过程。其方法有:



  • 过滤式:通过计算特征的统计量,如信息增益、方差等,来筛选特征;

  • 包裏式:将特征选择过程视为一个搜索问题,以模型的性能作为评价指标来选择特征子集;

  • 嵌入式:在模型训练过程中自动进行特征选择,如L1正则化会使一些特征的权重变为0,从而起到特征选择的作用。


特征选择可以降低数据维度,减少模型训练时间和过拟合风险,同时提高模型的可解释性。


 


本次的学习就到这里结束了,理论需要实践验证,技术渴望真实触感!我们为您准备了:


AIChat体验环境!


在这里,你可以尽情体验Smartbi 白泽 AIChat产品的强大功能,感受智能交互带来的便捷与乐趣。


体验中心入口:


AIChat体验环境(点击即可开启奇妙之旅)


帮助中心入口:


AIChat帮助中心遇到问题随时查阅)


相关学习视频:



欢迎大家前来体验~


 

发表于 2025-8-4 13:38:40
答案是:BBC
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 1 举报

发表于 2025-8-4 13:39:09
答案是:BBC
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 1 举报

发表于 2025-8-4 13:40:01
答案是:BBC
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 1 举报

发表于 2025-8-5 08:48:12
答案:BBC

回复

使用道具 举报

发表于 2025-8-5 11:16:49
答案是BBC
  •   Smartbi社区管理员
    前三名已经决出来啦!好可惜,但是新的知识问答有10个名额,快去抢答哦!在任务中心领取呢
    2025-8-11 14:28| 回复

回复

使用道具 举报

发表于 2025-8-6 09:03:04
答案是:BBC
  •   Smartbi社区管理员
    这个问答已经没有奖励名额了哦,但是新的知识问答有10个名额,快去抢答!在任务中心领取呢
    2025-8-11 14:29| 回复

回复

使用道具 举报

发表于 2025-8-6 09:47:53
答案是:BBC
  •   Smartbi社区管理员
    啊你这次来的太晚了,但是新的知识问答有10个名额,快去抢答哦!在任务中心领取呢
    2025-8-11 14:29| 回复

回复

使用道具 举报

发表于 2025-8-15 10:32:13
答案是:CBC
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

16回帖数 0关注人数 43941浏览人数
最后回复于:2025-8-15 10:32

社区

指南

快速回复 返回顶部 返回列表