七月上旬更新速递丨 聚焦集成、安全与AI深度进化

更新亮点: 本次重点强化系统集成能力与AI认知升级,新增4大核心模块9项资源,优化4项资源,点击标题了解(持续互动赢麦豆,解锁高阶技能)

重点推荐:《场景化数据分析实战》课程操作手册

配套六月王炸课程的全套落地指南,手把手教你复现实战场景!

二、实战技巧分享

高效处理资源集成难题》→ 从基础出发,深入探究集成的秘密

三、开发技能突破

第三方系统调用Smartbi接口》→讲解系统集成时的jar包获取,以及集成时代码调用的基本流程。

集成接口介绍》→梳理Smartbi目前提供的接口,以及不同接口的调用流程。

AI每日一学

DeepSeek-R1-0528模型升级:推理与生态的双重升级》→ 解析模型性能提升40%的关键技术 (技术前沿)

简单总结一下机器学习中的几种常见的学习方式与区别》→ 监督/无监督/强化学习差异与应用场景图解 (基础重构)

五、资源更新

CAS单点登录 V2版》上线→ 接入到 CAS 平台中,并实现单点登录

组织/用户/角色信息管理API接口》上线→ 一套 HTTP API的组织、用户、角色信息管理接口

竹云统一身份认证平台组织用户同步对接》上线→ Smartbi封装对应的服务接口,给竹云的统一身份认证平台实时调用,完成组织、用户和角色信息的实时同步。

交互式仪表盘支持自定义字体》优化→ 修复了文本组件编辑状态不生效的问题

只允许外网某种移动端APP访问》优化→ 针对V11版本,增加了钉钉、企业微信访问限制功能

AD域(LDAP/LDAPS)登录验证》优化→ 修复了“更新白名单状态之前没有判断判断用户是否存”的问题

元数据分析落地到知识库》优化→ 增加获取资源创建者的逻辑判断,对空值空对象等情况做优化

麦粉社区
>
帖子详情

【AI每日一学】DeepSeek-R1-0528模型升级:推理与生态的双重升级

AIChat 发表于 2025-7-11 15:23
发表于 2025-7-11 15:23:39

麦粉们注意啦!久违的AI实战落地系列第十五弹,现在火热发车!


          前段时间我们深入剖析了AI的“智能生物”——神经网络,就像摸透了跑车的每个零件。而今天就要带大家体验“驾驶员”的升级换代!当装备(算法/算力/数据)全面升级,驾驶员(模型)如何飙出更高性能?答案,就藏在DeepSeek-R1的震撼进化之中!


         不过,按照咱们的老规矩,先来个小测试,看看大家对之前“神经网络模型”的知识掌握得怎么样。小福利:现在只要在一周内答对问题的前三名麦粉,就可以奖励20麦豆哦!答案就藏在上期宝藏帖【通俗的讲一下神经网络模型的基本组成、工作原理、工作类型和生活应用场景】中,快去找找吧~


AI知识问答(知识巩固)


1、神经网络中负责“对输入数据加权求和,并通过激活函数决定是否传递信号”的基础单元是什么?


A. 层(Layer)


B. 卷积核(Kernel)


C. 神经元(Neuron)


D. 损失函数(Loss Function)


2、训练神经网络时,根据预测结果与真实值的差异来调整权重的方法叫什么?


A. 前向传播(Forward Propagation)


B. 梯度下降(Gradient Descent)


C. 反向传播(Backpropagation)


D. 特征提取(Feature Extraction)


3、以下哪种神经网络特别适合处理医学影像检测(如CT扫描识别病灶)?


A. 多层感知机(MLP)


B. 循环神经网络(RNN)


C. 卷积神经网络(CNN)


D. 生成对抗网络(GAN)


 


        通过知识巩固,相信大家对神经网络的“引擎构造”已了然于心。现在,正是时候见证这项技术的实战进化——当神经网络遇上DeepSeek-R1-0528的深度升级,AI的“思考力”将如何突破边界?答案就在今日的模型革新中!


 DeepSeek-R1-0528模型升级:推理与生态的双重升级(今日学习)


一、模型升级与核心能力突破


2025年5月29日,DeepSeek宣布推理模型DeepSeek-R1升级至Deep Seek-R1-0528版本,基于DeepSeek V3 Base 模型优化后训练,聚焦思维深度与推理能力提升。模型支持官网、App、小程序多端访问,API同步更新且调用方式不变,延续开发兼容性。


 


二、推理性能的国际对标表现


 升级后模型在数学、编程等基准测试中逼近国际顶尖水平


 


数学推理:


AIME 2024准确率91.4%(接近OpenAl o3的91.6%),AIME 2025准确率从旧版70%提升至87.5%,超越Gemini-2.5-Pro(83.0%)。思维链长度从12K tokens增至23K tokens,逻辑拆解更深入。


 


编程能力:


LiveCodeBench 代码生成准确率 73.3%,Aider 代码编辑准确率71.6%,接近o3水平,代码理解与生成能力显著提升。


 


综合推理:


GPQA科学测试81.0%、Humanity's Last Exam推理测试17.7分,优于多数国内模型,接近国际头部水平。


 


三、功能优化与场景扩展


幻觉控制:


改写、总结等场景幻觉率降低45%-50%,提升金融、科研等场景的内容可靠性。


 


创意写作:


长文本生成能力增强,如《端午咸》示例通过具象化描写传递情感,篇幅增长30%,语言更贴近人类表达。


 


工具调用:


支持连接外部 API开发应用(如生成单词卡片交互代码),但部分领域测评仍落后于国际顶尖模型。


 


四、技术开放与生态构建


API升级:


新增Function Calling 和结构化输出支持,max_tokens限制总输出长度(默认32K,最大64K),适配长文本需求。


 


开源策略:


模型以MIT 协议开源,提供64K(官方)与128K(第三方)上下文版本,私有化部署便捷。蒸馏思维链训练的Qwen3-8B模型性能超越原版10%,赋能小模型开发,已上架ModelScope 与Hugging Face。


 


五、总结


DeepSeek-R1-0528通过推理能力跃升与生态开放,成为国内大模型标杆之一,其“高精度推理+低幻觉+工具集成”特性适用于科研、开发等场景。开源与 API策略降低技术门槛,未来有望推动AI在垂直领域的深度应用。

发表于 2025-7-14 13:48:12
答案是 CCC
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 举报

发表于 2025-7-15 09:10:11
答案: CCC
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 举报

发表于 2025-7-18 10:24:19
答案CCC
打赏人数1麦豆 +20 收起 理由
Smartbi社区管理员 + 20

查看全部打赏


回复

使用道具 举报

发表于 2025-7-18 10:39:41
答案CCC

回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

8回帖数 0关注人数 613浏览人数
最后回复于:2025-7-18 10:39
快速回复 返回顶部 返回列表