一个好的数据分析师(Data Analyst)需要具备哪些技能?

数据分析师是数据师是专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。成为一个好的数据分析师需要具备哪些技能?

技能一:理解数据库。

还以为要与文本数据打交道吗?答案是:NO!进入了这个领域,你会发现几乎一切都是用数据库来存储数据,如MySQL,PostgreSQL,CouchDB,MongoDB,Cassandra等。理解数据库并且能熟练使用它,将是一个基础能力。

技能二:掌握数据整理、可视化和报表制作。

数据整理,是将原始数据转换成方便实用的格式,实用工具有DataWrangler和R。数据可视化,是创建和研究数据的视觉表现,实用工具有ggvis,D3,vega。数据报表是将数据分析和结果制作成报告。也是数据分析师的一个后续工作。这项技能是做数据分析师的主要技能。可以借助新型软件帮助自己迅速学会分析。如大数据魔镜可视化分析软件(“魔镜”)既可以满足企业需求,也可以适应个人需要,是进行数据分析的一个新型而精准的产品。

技能三:懂设计

说到能制作报表成果,就不得不说说图表的设计。在运用图表表达数据分析师的观点时,懂不懂设计直接影响到图形的选择、版式的设计、颜色的搭配等,只有掌握设计原则才能让结果一目了然。否则图表杂乱无章,数据分析内容不能良好地呈现出来,分析结果就不能有效地传达。

技能四:几项专业技能

统计学技能——统计学是数据分析的基础,掌握统计学的基本知识是数据分析师的基本功。从数据采集、抽样到具体分析时的验证探索和预测都要用到统计学。

社会学技能——从社会化角度看,人有社会性,收群体心理的影响。数据分析师没有社会学基本技能,很难对市场现象做出合理解释。

另外,最好还能懂得财务管理知识和心理学概况。这些都将会使你做数据分析的过程更容易。

技能五:提升个人能力。

有了产品可以将数据展示出来,还需要具备基本的分析师能力。首先,要了解模型背后的逻辑,不能单纯地在模型中看,而要放到整个项目的上下文中去看。要理解数据的信息,形成一个整体系统,这样才能够做好细节。另外,与数据打交道,细心和耐心也是必不可少的。

技能六:随时贴近数据文化

拥有了数据分析的基本能力,还怕不够专业?不如让自己的生活中充满数据分析的气氛吧!试着多去数据分析的论坛看看,多浏览大数据知识的网站,让自己无时无刻不在进步,还怕不能学会数据分析吗?

拥有这些技能,再去做数据分析,数据将在你手里变得更亲切,做数据分析也会更简单更便捷,速成数据分析师不再遥远。


作者:周芩
链接:https://www.zhihu.com/question/20356005/answer/51693905

数据分析师的能力模型是数据分析面试的时候,常会被问到的一个问题,对这个问题的理解能够体现出候选人对这一职位的理解和未来发展的思考。

以我的理解来讲,数据分析师的元能力是 问题解决能力, 此外,解决更负责的问题要求我们具有 管理能力 ,通过团队的共同努力解决问题。

首先我列出了数据分析师整体的能力模型框架,接下来,我们根据问题解决的步骤对这一框架进行拆解,看看是什么支撑着我们达成目标。

数据分析师能力模型

问题解决框架各部分所需能力说明

1 了解和界定问题

这部分来说,最重要的是 沟通能力

工作场景下,我们会接触大大大小小,不计其数的问题和需求,它们可能来自于领导、同事、业务团队,甚至我们自己。

工作是无限的,但人的时间和精力是有限的。因此,当我们最初接触一个问题,先不要进入实际的问题思考和解决,而是要先明确:

这个问题的背景是什么?问题背后隐含的实际需要是什么?

解决后(对公司、对团队、对个人)的收益是什么?是否急需解决?

什么样的产出形式是合适的?问题需要解决到怎样的程度?

上述问题的答案决定了我们是否要解决一项问题、问题的紧急程度,以及怎样解决一项问题,而获取答案的过程,依赖于和需求方持续、深入、良好的沟通

2 问题拆解

问题拆解需要良好的 商业认知、业务理解和逻辑思维能力

问题拆解最重要的方法是议题树(Issue Tree)的搭建。对于议题树,我们要求它遵循MECE的原则,即完成穷尽、相关独立。

一方面,我们希望议题树能够覆盖到问题的各个方面,不产生遗漏。这依赖于行业经验,或是对行业专家进行访谈、咨询,但总的来说,是依赖于对业务的理解。

另一方面,议题树的各个部分应该是相互独立的,不能发生重叠。与完全穷尽不同,对于相互独立我们完全可以从逻辑出发,选取合适的划分标准避免发生重叠。

例如,我们希望提升知乎用户的人均回答阅读量,要如何搭建议题树呢?

人均回答阅读量 = 人均问题曝光量 x CTR x 每问题回答阅读量

从上面的公式可以看出,人均回答阅读量这一指标,被拆解成了人均问题曝光量、CTR(点击率)、每问题回答阅读量(= 回答阅读量/问题点击量)这几个指标的乘积。

因此,提升日均回答量这一问题就变成了提升人均问题曝光量、提升CTR、提升每问题回答阅读量这几项子议题。

3、4 议题筛选与排序 & 详细的工作计划制定

议题筛选与排序需要对各项子议题的价值进行判断,工作计划制定包含工作项、负责人、排期、产出成果等。

大的方面来说,就是 项目管理 的能力,细化起来,包括沟通、信息收集、工作分配、时间管理等。

5 主要议题分析

这一步就是我们狭义上所说数据分析的范畴,包括数据获取、数据处理、数据分析、数据展示、报告撰写。

数据获取:企业内部数据基本使用 SQL ,外部或非公开数据则依赖 信息检索能力、访谈、ColdCall 等多种方式获取;

数据处理:数据处理手段多种多样,主要是工具、技术的使用,非编程的包括 Excel、BI工具、SPSS、SAS 等,编程类的包括 R (学术界较多)、 Python (企业界较多)等

数据分析:统计知识、机器学习算法

数据展示:可视化工具与数据处理所需的类似,不再赘述,软性能力方面主要包括对 图表作用的认知、设计能力

报告撰写:结构化的 逻辑思维、PPT设计制作

6 成果汇报与落地执行

工作中,不能够只做不说,同时,数据分析做为一项支持性工作,工作价值的产生也依赖于产出成果的落地执行。

因此, 表达能力、方案执行的落地推进能力 也是重要的技能,甚至是进阶高级分析师或是管理职位的必备要素。


作者:RAYW
链接:https://www.zhihu.com/question/20356005/answer/846976024