十二月下旬内容焕新丨技能实战、智慧提效与生态拓展

年终冲刺,进步不停!十二月下旬新内容聚焦技能实战、智慧提效、场景解析与开发拓展,助你在数据与智能的浪潮中更进一步!

一、场景化课程上线完结

驱动增长:汽车制造营销分析主题课程→聚焦汽车行业营销场景,学习如何利用数据驱动业务增长。

价值引擎:汽车制造财务分析主题课程→深入财务数据分析,助力企业价值挖掘与决策支持。

二、场景应用上线

【漏斗图】漏斗洞察:三分钟,看透流程的每一步→ 快速掌握漏斗分析,优化业务流程效率。

模型篇:如何构建支撑AlChat的证券数据模型》→ 解析证券行业数据模型构建,赋能AI助手智能基础。

【地图】先导篇:一眼看透数据在空间中的故事→ 入门地图可视化,发现数据背后的地理逻辑。

【地图】区域地图:直观对比,掌控全局→ 学习区域地图制作,实现跨区域数据对比分析。

三、技术经验分享

乱码大作战:从“乱码地狱”到“数据天堂”的爆“效”指南》→ 攻克数据乱码难题,带你高效实现数据质量的跃升。

四、二次开发视频

扩展包开发知识点——知识库升级以及查询对象》→ 深化扩展包开发能力,学习知识库升级与查询对象优化。

五、任务持续上线

【图表应用】绘制漏斗图,诊断转化瓶颈→ 学习漏斗图绘制,精准定位业务流程中的转化短板。

AlChat入门闯关计划 - 第二关》→ 继续AI助手探索之旅,掌握更智能的对话交互技能。

【图表应用】测测你是否真的“看懂”地图?》→ 检验地图图表理解能力,提升空间数据解读水平。

【场景实战系列】即席查询,赢取278麦豆!》→ 实战演练即席查询,灵活获取所需数据。

【场景实战系列】透视分析,赢取278麦豆!》→ 掌握数据透视技巧,实现多维度业务洞察。

【图表应用】区域地图在手,业绩分布一目了然→ 借助区域地图,直观掌握业务区域表现。

BI知识闯关】乱码大作战:从“乱码地狱”到“数据天堂”的爆“效”指南》→ 通过闯关巩固乱码处理知识,学以致用。

【调研】社区内容调研,1分钟即可得100麦豆!》→为了未来能为您提供更精彩的内容和活动,我们想聆听您的真实心声

六、全新素材上线

HTTP API接口测试工具》→ 提供便捷的接口测试支持,助力开发调试更高效。

七、互动活动开启

2025年售后服务问卷调研有奖活动》→ 参与调研反馈,助力产品优化,更有机会赢取好礼。

麦粉社区
>
帖子详情

【AI每日一学】什么是训练集?什么是验证集?什么是测试集?

AIChat 发表于 2025-7-21 11:02
发表于 2025-7-21 11:02:01

麦粉集合!AI实战落地系列第十七弹极速启航!


         上回我们深入剖析了机器学习的四大"驾驶模式"——监督、无监督、半监督与自监督学习,就像掌握了不同路况的通行法则。而今天要揭秘的是"训练赛道"的黄金分割术——当模型踏上学习之旅,如何科学划分数据资源才能跑出最佳成绩?答案就在训练集、验证集与测试集的战略分工中!


         按照老规矩,先来一场知识巩固小测试,还有小福利哦:一周内答对的前三名的麦粉,奖励20麦豆!答案藏在上期神帖【简单总结一下机器学习中的几种常见的学习方式与区别】中~


AI知识问答(知识巩固)


1、监督学习的核心痛点是什么?


A. 模型结构复杂


B. 需大量人工标记数据


C. 无法发现数据隐藏规律


D. 仅支持分类任务


2、无监督学习最适合处理哪类任务?


A. 房价预测


B. 客户群体聚类


C. 图像分类


D. 股票涨跌预测


3、自监督学习如何减少对标注数据的依赖?


A. 通过数据自身生成监督信号


B. 融合半监督学习框架


C. 增加模型参数量


D. 采用强化学习机制


       


         通过这场测试,相信大家对"学习方式"的战略选择已了然于心!现在,我们直击模型训练的核心战场——如何用三大数据集为AI打造"训练-调试-终测"的全流程闭环?今日干货再度拉满,系好安全带,出发!


什么是训练集?什么是验证集?什么是测试集?(今日学习)


在机器学习和深度学习中,训练集、验证集和测试集是用于模型训练、评估和调优的不同数据集,以下是它们的具体介绍:


训练集


-定义:


是用于训练机器学习模型的数据集,包含了大量的输入特征和对应的目标输出,模型通过学习训练集中的数据来调整自身的参数,以尽可能准确地预测目标输出。


 


-作用:


让模型学习数据中的模式和规律,例如在一个预测房价的模型中,训练集包含了房屋的各种特征(面积、房间数等)以及对应的实际房价,模型通过对训练集的学习,建立起房屋特征与房价之间的关系。


 


验证集


-定义:


在模型训练过程中,用于评估模型性能和调整超参数的数据集。它不参与模型的训练过程,而是在训练过程中定期用来验证模型的泛化能力。


 


-作用:


帮助选择最优的模型超参数,防止模型过拟合。例如,在选择神经网络的层数、学习率等超参数时,可以通过观察模型在验证集上的性能表现来确定最佳的取值。


 


测试集


-定义:


在模型训练和调优完成后,用于最终评估模型性能的数据集。它是模型在训练过程中从未见过的数据,能够真实地反映模型在实际应用中的泛化能力。


 


-作用:


提供一个客观的评估指标,如准确率、召回率、均方误差等,来衡量模型的优劣。例如,一个图像分类模型在测试集上的准确率为90%,就表示该模型在对新的、未见过的图像进行分类时,预计有90%的图像能够被正确分类。


 


注解说明


超参数



  • 定义:模型训练前设定的参数,如学习率、网络层数,影响模型学习效果和速度。

  • 作用:超参数是机器学习模型中的“控制旋钮”,它们通过调整模型的复杂度、训练过程和泛化能力,直接影响模型的性能和效率。


过拟合



  • 定义:指的是模型在训练集表现好,但在新数据上差,即过度适应训练数据,泛化能力弱。过拟合通常是由于模型过于复杂或者训练数据量过少导致的。


 


特大消息!AIChat体验环境正式上线!


在这里,你可以尽情体验Smartbi 白泽 AIChat产品的强大功能,感受智能交互带来的便捷与乐趣。


体验中心入口:


AIChat体验环境(点击即可开启奇妙之旅)


帮助中心入口:


AIChat帮助中心遇到问题随时查阅)


相关学习视频:



欢迎大家前来体验~


 

发表于 2025-7-22 08:37:07
B,B,A
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 1 举报

发表于 2025-7-22 08:55:27

賺點積分

回复

使用道具 举报

发表于 2025-7-22 13:55:17
B、B、A
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 1 举报

发表于 2025-7-22 13:57:15
答案是 BBA
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 举报

发表于 2025-7-28 09:00:06

BBA


回复

使用道具 举报

发表于 2025-8-2 15:05:02
答案是
BBA
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

10回帖数 0关注人数 1626浏览人数
最后回复于:2025-8-2 15:05
快速回复 返回顶部 返回列表