加入收藏 | 设为首页 | 会员中心 | 我要投稿 湘西站长网 (https://www.0743zz.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

数据分析师必备的9大技能,大多数人只知道一半

发布时间:2019-10-20 00:29:53 所属栏目:MySql教程 来源:数据分析不是个事儿
导读:【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 昨天有位刚入行数据分析的朋友跟我吐槽,自己入门到现在只会用excel做做分析图表,但是感觉越做越没有价值,数据分析似乎就是业务数据的分析员,不知道该如何提升自己。 这是因为他没有完
副标题[/!--empirenews.page--] 【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》

昨天有位刚入行数据分析的朋友跟我吐槽,自己入门到现在只会用excel做做分析图表,但是感觉越做越没有价值,数据分析似乎就是业务数据的分析员,不知道该如何提升自己。

数据分析师必备的9大技能,大多数人只知道一半

这是因为他没有完全把数据分析的价值挖掘出来,数据分析是为了通过对数据现象的查看来完成对产品、营销策略、运营策略的优化,不仅是对业务,更重要的是要掌握数据分析的各种技能,从能力增长上突破职业的天花板。

根据我总结的经验,一个合格的、高级的大数据分析师必须要掌握以下9种技能:

  • 统计分析:大数定律、抽样推测规律、秩和检验、回归、预测;
  • 可视化辅助工具:excel、BI工具、python
  • 大数据处理框架:Hadoop、storm、spark
  • 数据库:SQL、MySql、DB
  • 数据仓库:SSIS、SSAS
  • 数据挖掘工具:Matlab、R语言、python
  • 人工智能:机器学习
  • 挖掘算法:数据结构、一致性
  • 编程语言:Java、python
数据分析师必备的9大技能,大多数人只知道一半

一、统计分析

众所周知,统计学是数据分析的基石。学了统计学,你会发现很多时候的分析并不那么准确,比如很多人都喜欢用平均数去分析一个事物的结果,但是这往往是粗糙的的。而统计学可以帮助我们以更科学的角度看待数据,逐步接近这个数据背后的“真相”。

大部分的数据分析,都会用到统计方面的以下知识,可以重点学习:

基本的统计量:均值、中位数、众数、方差、标准差、百分位数等

概率分布:几何分布、二项分布、泊松分布、正态分布等

总体和样本:了解基本概念,抽样的概念

置信区间与假设检验:如何进行验证分析

相关性与回归分析:一般数据分析的基本模型

了解统计学的原理之后,你不一定能够通过工具实现,那么你需要去对应的找网上找相关的实现方法,也可以看书。

先推荐一本非常简单的:吴喜之-《统计学·从数据到结论》;也可以看《商务与经济统计》,结合业务能更容易理解。

另外,如果想要更进一步,请掌握一些主流算法的原理,比如线性回归、逻辑回归、决策树、神经网络、关联分析、聚类、协同过滤、随机森林。

数据分析师必备的9大技能,大多数人只知道一半

再深入一点,还可以掌握文本分析、深度学习、图像识别等相关的算法。关于这些算法,不仅需要了解其原理,你最好可以流畅地阐述出来,还需要你知晓其在各行业的一些应用场景。如果现阶段不是工作刚需,可不作为重点。

二、可视化辅助工具

数据可视化主要通过编程和非编程两类工具实现,对于普通行业的数据分析师来说,不需要掌握编程类的可视化工具,学习麻烦而且没有必要,掌握下面几种即可:

1、excel

别以为EXCEL只会处理表格,你可以把它当成数据库,也可以把它当成IDE,甚至可以把它当成数据可视化工具来使用。它可以创建专业的数据透视表和基本的统计图表,但由于默认设置了颜色、线条和风格,使其难以创建用于看上去“高大上”视觉效果。尽管如此,我仍然推荐你使用Excel。

2、BI工具

近几年冒出来的BI之秀,如TB、qlk都强调可视化,一改传统BI工具SAP BO、IBM家的cognos(不过近几年貌似都在研发云BI)。这里不谈开源,还没见到能成熟应用的BI。成熟的BI工具如 FineBI (国内)和 Tableau(国外),都很推荐。

数据分析师必备的9大技能,大多数人只知道一半

tableau可视化探索分析很赞,数据量多的时候性能较差,企业用多并发价格贵。FineBI 国产帆软,为数不多能占据世界领先地位的数据工具,重在数据处理性能和企业应用的复杂情况(市场步伐很快),自带ETL,可视化还行,价格良心,个人用免费。

3、python

学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等,这些可视化库都有自己的特点,在实际应用中也广为大家使用。

如果你不知道数据分析该学什么工具,就直接学python吧,万能语言学了不亏。

三、大数据处理框架

如果你想脱离普通业务的束缚,做一名大数据分析师,首先就要了解大数据框架的基础。

大数据处理框架负责对大数据系统中的数据进行计算,数据包括从持久存储中读取的数据或通过消息队列等方式接入到系统中的数据,而计算则是从数据中提取信息的过程。

我们按照对所处理的数据形式和得到结果的时效性进行分类,分为批处理系统、流处理系统和混合式系统。典型的批处理系统就是Apache Hadoop;典型的流处理系统有Apache Storm,Apache Samza;混合处理系统比如Apache Spark,Apache Flink。

数据分析师必备的9大技能,大多数人只知道一半

四、数据库

数据分析是分等级的,有只负责清洗数据的,比较少,工作也比较简单;还有就是负责建模的,掌握常用的十多个机器学习算法就能是二流的了,要做到一流的就要熟练掌握各个算法的本质了,也就是要掌握数据库的基础。

sql在数据库里是核心技术,在数据分析学习时一定要重视这些内容,主要以MySQL为主,MySQL就是互联网行业的通用标准。

当然,如果你想要快速掌握数据库的知识,一定要进行系统化的学习以及大量的练习,在网上寻找一些数据库的练习题,先从简单的题开始,循序渐进,这样才能够慢慢的深入数据库的核心知识。

五、数据仓库/商业智能

(编辑:湘西站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读