处理大数据一直是EXCEL的硬伤,就拿我来说,每次要处理几百万行以上的数据时,EXCEL总是给我拖后腿,表格打开后不断出现卡死,非常令人苦恼,恨不得把电脑砸了。由于不会其他的工具,只能把数据拆成好几份,再把最后的结果进行汇总相加。如果遇到数据有错误的时候,又得重新做一次,不加班是不可能的了,哎,真是苦命的孩子。我相信很多用EXCEL的朋友们都深有同感,恨不得赶快去学习一门大数据处理的方法。
抱着忐忑不安的心情去请教了一下其他做数据工作的朋友,他们说一定要学习PYTHON、数据库和POWER BI这些大数据处理工具,如果不会这些的话,这么大的数据量是没有办法处理的。但是我又没有专门学习过这些课程,没有任何的基础,学习起来相当的吃力,如果不花个一年半载的话,很难把这几个工具吃透。直到有一天,我从朋友的口中知道了一个比较强大的EXCEL插件:智分析。
什么叫插件呢?你可以这样理解,就是EXCEL额外增加的功能,如果你有玩过游戏的话,应该知道游戏可以安装很多脚本补丁,可以给游戏增加很多原先没有的东西,添加不少的乐趣。EXCEL也是一样的道理,如果没有安装插件的话,就只能使用常规性的功能,如果安装了插件,那效果就不一样了,可以带来非常多的功能,例如方方格子这种就是插件了。这些插件的作用就是可以补充EXCEL的不足,发挥出非常强大的威力,做EXCEL做不了的事情。
那么智分析最个插件厉害的地方在哪里呢?没错,是数据库。EXCEL本身也是可以连接各种数据库的,如果你对EXCEL稍微有点了解的话,就知道在下图这个位置里可以操作连接数据库的,但是遗憾的是微软并没有把各家数据库的驱动集成到office安装包中,所以当你想连接数据库时,会弹出提示窗口—“此连接需要安装一个或多个其他组件才能使用”。其实操作起来也是有点复杂的,如果你对数据库不熟悉的话,可能你也会花上大半天的时间去折腾,还不一定能搞定,反正是非常的不方便。
既然这么麻烦,那我还是用智分析去连接数据库好了,原来支持的数据库产品还挺多的,常用的例如MYSQL、阿里云等数据库基本都支持,如果你不擅长使用数据库的话,可以把EXCEL或者是CSV文件导进去,把数据源保存在云端的数据库里,不要说千万行的数据量,就是亿万行的数据量也不在话下。
数据导进去之后,在EXCEL的界面里就会出现一个数据集面板,你可以通过拉拽的方式把分析字段拉拽到EXCEL里去进行分析。这个原理很好理解,就是EXCEL和云端上的数据库是连接好的,只要在EXCEL登录了这个插件,EXCEL便可以随时调用保存在云端数据库里的数据,拉拽到EXCEL可以做其他的分析,例如建立透视表或者是做数据可视化。这个过程既可以提高运行速度,又可以节省电脑磁盘空间,简直处理大数据的一大神器。如果你外出的没有携带电脑,只要在EXCEL里登录了账号密码,便可以随时随便去调用云端里的数据进行进行分析,是不是特别神奇和方便呢?
为了测试云端数据库的运行速度,我还特地去找了一份100万行数据的文件导进去去处理,结果显示智分析拉取字段和建立透视表只需要几秒钟便可以完成,天哪,100万行的数据量只需要几秒!如果用EXCEL单独处理的话,光打开这份数据源就已经花了2分46秒,再建个透视表的话,可能又会卡死了。通过这个测试,结果是显而易见的,智分析在面对大数据时有着非常惊人的表现。
在这个信息快速发展的时代,会使用数据库或者写代码已经成为了每个数据工作者的标配,如果你不会这些,也不要紧,也有其他可以替代的工具,例如智分析。它的价值并不在于可以做多少手工做不了的事情,而是它是EXCEL的延伸,可以把EXCEL的功能尽量地最大化,完美地保留了EXCEL的优点,并弥补了EXCEL最薄弱的地方。如果你有处理大数据问题的困扰,又恰好不懂的太多技术,可以尝试一下这款轻量级的大数据处理工具。
|