数据分析” 可谓是当今社会一个超级火爆的岗位,不论是科班的,还是非科班的,都想从事这个行业,毕竟都觉得这个行业赚钱多嘛。
“数据分析” 大致可以分为业务和技术两个方向,不管你是从事哪个方向,都对技能有一定的要求。业务方向,像数据运营、商业分析、产品经理等,对技术的要求相对来说低一点,编程工具你只要会用即可(肯定是越精通越好)。技术方向,像数据算法工程师、数据挖掘工程师等,对技术的要求就很高了,必须要有很好的编程能力。
工欲善其事必先利其器,说起数据分析工具,大家都会感觉很迷茫,有这么多数据分析工具,我应该学习哪个工具,它们之间的区别到底是什么?今天我们从 “工具” 层面带大家盘点一下,作为一名数据分析师,应该学习哪些工具呢?
一、Excel工具
说起用什么做数据分析,很多人的脑海中都会不约而同地想到Python、R、SQL、Hive等看似很难掌握的数据分析工具,它们就像数据分析路上的拦路虎一样,让人踟蹰不前。
其实,在众多的数据分析工具中,Excel属于最常用、最基础、最易上手的一款数据分析工具。Excel的功能十分强大,它不仅提供了众多的数据处理功能,像Excel函数能够帮助我们做数据整理,数据透视表帮助我们快速、高效的做各种维度分析,形形色色的图表能帮我们形象地展示出数据背后隐藏的规律,同时Excel还有很专业的数据分析工具库,包括描述性统计分析、相关系数分析等。
Excel对于转行数据分析的小白来说,应该是最友好的。大家都知道“转行”其实是一件很困难的事儿,但是你学会了Excel,是完全可以找到一份“数据”相关的工作的,只有踏进数据领域,你才有可能从事其它更多的数据岗位。
二、BI工具
BI工具是专门按照数据分析的流程进行设计的,也是专门用于数据分析的工具。仔细观察这些工具后,它们的基本流程是:【数据处理】-【数据清洗】-【数据建模】-【数据可视化】。
关于BI工具,其实有很多你估计已经用到过,比如说Tableau、Power BI,还有帆软FineBI等。今天我们就分别带着大家来盘点一下,这三款工具。
1、Tableau
Tableau是一款交互式数据可视化软件,它的本质其实也是Excel的数据透视表和数据透视图。
Tableau也是很好的延续了Excel,只需要简单地拖拽,就能很快地实现数据的分类汇总,然后拖拽实现各种图形的绘制,并且可以实现不同图表之间的联合。
Tableau同时支持数百种数据连接器,包括在线分析处理(OLAP)和大数据(例如NoSQL,Hadoop)以及云数据,至少现在你能学到的数据库软件,Tableau基本都能够实现与其数据之间的互动。
2、Power BI
Power-BI是一款(BI)商业智能软件,于2014年发布,旨在为用户提供交互式的可视化和商业智能,简单的数据共享,数据评估和可扩展的仪表板等功能。。
大家可能都知道,Power BI以前是一款Excel插件,依附于Excel,比如Power Query,PowerPrivot, Power View和Power Map等,这些插件让Excel如同装上了翅膀,瞬间高大上,慢慢地就发展成为现在的Power BI数据可视化工具。
Power BI 简单且快速,能够从 Excel电子表格或本地数据库创建图表。同时Power BI也是可靠的、企业级的,可进行丰富的建模和实时分析,及自定义开发。因此它既是你的个人报表和可视化工具,还可用项目、部门或整个企业背后的分析和决策引擎。
同时,无论你的数据是简单的 Excel电子表格,还是基于云和本地混合数据仓库的集合, Power BI都可以让你轻松地连接到数据源,直观看到或发现数据的价值,与任何所希望的人进行共享。
3、FineReport
帆软是业内做报表比较久的一家公司,使用类excel风格的界面,可添加图表和数据源,也可实现大屏效果。
其实它的类Excel风格界面,应该是它区别于Tableau工具的一个很重要的点。FineReport 通过直接连接到各种数据库,就能方便快捷地自定义各种样式,从而制作周报、月报和季报、年报。
用过FineReport 的朋友,还会有另外一种体会,它的图形效果比Tableau要酷炫的多,操作起来同样也是那样的方便。另外,FineReport 的个人版本是完全免费的,并且所有功能都是开放的,大家赶紧下去试试吧。
4、FineBI
关于FineBI,这是目前市面上应用最为广泛的自助式BI工具之一,类似于国外的Tableau等BI分析工具,但FineBI在协同配合,数据权限上,能更好的解决国内企业的情况。
但严格定义来讲,它其实是一款自助式BI。支持Hadoop、GreenPlumn、Kylin、星环等大数据平台,支持SAP HANA、SAP BW、SSAS、EssBase等多维数据库,支持MongoDB、SQLite、Cassandra等NOSQL数据库,也支持传统的关系型数据库、程序数据源等。
5、Python & R
其实不管是Excel,还是介绍的三款BI工具,它们都是为了执行特定功能,而设计出来的。如果说某一天,既定功能不能很好,或者说不能满足你的需求,那么应该怎么办呢?
这就需要我们了解,并学习一点编程语言了,最大的优势就在于:它非常强大和灵活。不管是R或者 Python,都有很多包供我们调用,同时也可以自定义函数,实现我们的某些需求。