麦粉社区
>
帖子详情

[热点新闻] 尴尬!EXCEL百万行数据就歇菜了,还把英国政府坑了一波

智分析 发表于 2021-9-27 15:01
发表于 2021-9-27 15:01:26
  前段时间发生了一个尴尬的新闻,据英国媒体报道,英国的卫生部门公开承认由于“技术故障”问题导致新冠病例的统计数据出现了失误,遗漏了将近16000个病例,英国公共卫生部临时首席执行官迈克尔·布罗迪表示,一部分阳性测试结果的文件大小超出了系统限制,导致了这几天检测数据的丢失。据英国媒体猜测,这是由于EXCEL“bug”导致的,因为EXCEL1048576行的最大行数限制,超出这个行数的数据没有办法统计进去。

1.png

  由于及时发现了这个“技术故障”,英国卫生部门随后对数据进行了更正,所以在之后的几天里出现了暴增22961名新冠病例的情况,这包括了前面积压遗漏的数据。此事立马在英国国内引起了轩然大波,很多政要纷纷指责英国政府对待工作不负责任,给民众造成了极大的恐慌,并要求英国卫生部门作出合理的解释,公布弥补的措施。

2.png

  我们把这个事情捋一捋,造成这个失误的真正原因真的是EXCEL吗,让EXCEL背这个锅是否合理?我们都知道,EXCEL的最大行数是1048576,但很多人不知道为什么是这个数字,按照通用的说法,那就是EXCEL运用的是一种内存算法,是一个使用行、列进行索引的树形存储算法,对添加删除还是稀疏矩阵都有很高的效率,支持1048576行和16384列,如果再多层级加多那效率将会指数级别降低。所以超过这个行数的话,EXCEL便没有办法进行记录。

3.png

  如果硬说这个是EXCEL的锅,恐怕EXCEL也是不服的,毕竟微软研发EXCEL的初衷并不是要让它去处理大数据,而是让要它成为大众化的数据处理软件。就好比说,你要让摩托车去跑出飞机的速度那是不可能的,EXCEL的适用场景更多在于轻量级的数据里。那么EXCEL如何处理超过100万行的数据量呢?目前来说只有一个比较土的办法,就是利用工具把EXCEL文件分成几段去处理,但是这个方法非常麻烦,而且效率不高。

4.png

  除了把文件进行分割的方法之外,还有一个更加给力的办法,那就是安装一个智分析插件,这个插件的厉害之处在于可以让EXCEL去连接外部的数据库,然后在EXCEL里调用数据库中的字段进行分析,下面给大家介绍一下详细的操作步骤。

1、 安装插件
  在EXCEL中安装好插件,工具栏中会出现一个新的操作界面:

5.png

2、 导入文件
  在EXCEL的工具栏中可以看到导入文件的按钮,你可以把本地的数据源文件导进云端的数据库中,也可以在网页端连接你的外部数据库(musql、oracle等):

6.png

7.png

3、 拖拽数据
  在EXCEL的数据集面板里找到你的数据源文件,并把字段拉拽到EXCEL中进行分析,可以选择全部字段,也可以选择其中的几个字段,通过鼠标操作拖拽即可:


8.png

4、 刷新数据
  把数据字段拖拽好之后,然后在EXCEL里点击刷新,这时EXCEL会把数据库中的字段刷新出来。这个方法的好处就是无需打开庞大的数据源文件,只需要把EXCEL与数据库建立连接之后,在EXCEL里便可以调用数据库中的字段,不仅突破了EXCEL百万行数的限制,而且操作起来非常方便。

9.png

  我们在用EXCEL处理数据时,总是会遇到超过百万行数据量的报表,往往会力不从心,现在终于遇到了一个比较靠谱的解决方法,那就是利用插件的形式,轻松处理超过百万行的数据,对于经常要使用EXCEL的用户来说,真是一大福音。如果你还想了解EXCEL更多实用的功能,欢迎查阅我的其他文章,如果你有更加实用的方法,也欢迎你在文章下方留言。

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

0回帖数 0关注人数 3463浏览人数
最后回复于:2021-9-27 15:01
快速回复 返回顶部 返回列表