免费试听课倒计时2天!手把手带你成为一名Data Analyst!
重磅消息
SQL/Python
Data Science训练营
免费试听课
7.31正式上线
名额有限,快来咨询报名
01 行业前景
据 IBM 预测,未来3年,公司对Data类岗位需求量将猛增28%。
到2020年,所有美国Data类岗位数量将增加36万个,总数达到270万。
资料来源:IBM
另外麦肯锡预测,到2018年,在“具有深入分析能力的人才”方面,美国可能面临着14万~19万人的缺口,而“可以利用大数据分析来作出有效决策的经理和分析师”缺口则会达到150万。
金融、互联网科技和传媒、零售企业中,数据的用处十分广泛,不但能分析客户行为,还可以最大程度发现客户价值。
02 职业规划
关于数据分析方向求职的职业规划,小编会从不同领域和不同路线帮大家深入解读下:
不同领域
“领域”是不少刚接触数据分析的新人常忽略的要素,其实数据分析不会脱离业务存在。你进入哪个行业,很大程度会决定你初期的技能树和技能点。
举例:金融领域的风控模型/反欺诈模型、营销领域的生命周期、广告领域的点击率预估等,电商行业的推荐系统和用户画像系统各有各的特色。
不同路线
数据分析职业发展的路线大致可以划分成四大方向:
- 数据分析
- 数据挖掘
- 数据产品
- 数据工程
1. 数据分析/数据运营/商业分析
这是业务方向的数据分析师。绝大部分人,都是从这个岗位开始自己的数据之路,也是基数最大的岗位。
- 负责和支撑各部门相关的报表;
- 建立和优化指标体系;
- 监控数据的波动和异常,找出问题;
- 优化和驱动业务,推动数据化运营;
- 找出可增长的市场或产品优化空间;
- 输出专题分析报告;
2. 数据挖掘/算法专家
这是技术向的数据岗,有些归类在研发部门,有些则单独成立数据部门。数据挖掘工程师要求更高的统计学能力、数理能力以及编程技巧。
常见数据挖掘项目的闭环如下:
- 定义问题
- 数据抽取
- 数据清洗
- 特征选取/特征工程
- 数据模型
- 数据验证
- 迭代优化
3. 数据产品经理
这个岗位比较新兴,它有两种理解,一种是具备强数据分析能力的Product Manager,一种是公司数据产品的规划者。
前者,以数据导向优化和改进产品。在产品强势的公司,数据分析也会划归到产品部门,甚至运营也属于产品部。这类产品经理有更多的机会接触业务,属于顺便把分析师的活也干了,一专多能的典型。他们会运用不同的数据源,对用户的行为特征分析和挖掘,达到改进产品。最典型的场景就是AB测试。大到页面布局、路径规划、小到按钮的颜色和样式,均可以通过数据指标评估。
后者,是真正意义上的数据产品经理。在公司迈大迈强后,数据量与日俱增,此时会有不少数据相关的产品项目:包括大数据平台、埋点采集系统、Business Intelligence、推荐系统、广告平台等。这些当然也是产品,自然需要提炼需求、设计、规划、项目排期,乃至落地。
4. 数据工程师
数据工程师其实更偏技术,从职业道路上看,程序员走这条路更开阔。在很多中小型的公司,一方面数据是无序的、缺失的、原始的,另外一方面各种业务报表又需要处理。这时候分析师只能各种任务自己动手,兼做数据清洗+ETL(提取转换加载)+商业智能
03 如何成为一名数据分析师?
当数据分析数据挖掘技术成为商业领域的重要推动力,对从业者的要求也相对提高。
1 数据分析基础
抛开对业务层面的基本理解,学好数据分析首先需要了解统计学,统计分析是数据分析的基础,也是灵魂。统计分析的几个核心内容:
- 描述统计,统计推断,概率论;
- 抽样,分布,估计,置信区间,假设检验;
- 线性回归,时间序列;
2 数据分析工具
根据作者DataCastle在CSDN发表的文章整理出的企业对数据分析的技能要求大致有以下几点:
- SQL数据库的基本操作,会基本的数据管理
- 会用Excel/SQL做基本的数据提取、分析和展示
- 会用脚本语言进行数据分析,Python or R
- 有获取外部数据的能力加分,如爬虫或熟悉公开数据集
- 会基本的数据可视化技能,能撰写数据报告
- 熟悉常用的数据挖掘算法:回归分析、决策树、分类、聚类方法
(cr: https://blog.csdn.net/DataCastle/article/details/78033108)
1. Excel
作为微软的一个出色表格处理工具,Excel也是数据分析师需要掌握的。因为公司很多其它部门非技术人员是不会使用编程工具的,而会使用相对简单的Excel来处理一些报表。这个时候就可能需要你可以在Excel中做一些数据分析工作然后反馈,但是也不必太深入,掌握核心的功能即可,比如:
- 增删改查
- 各类常用函数的使用
- 各类基础图标的制作
- 数据透视表等
2. R/Python
R语言就是为统计学而设计的语言,是目前主流数据应用软件之一,非常适合于数据分析与数据挖掘。而Python作为目前非常火爆的语言,绝大部分新的数据科学工具都兼容它,并且由于其出色的科学计算library的存在,也是很多人的不二选择。
资料来源:DataFlair
3. SQL
SQL作为最经典的数据库工具,为海量数据的存储与管理提供可能,并且使数据的提取的效率大大提升。你需要掌握以下技能:
1)提取特定情况下的数据:企业数据库里的数据一定是大而繁复的,你需要提取你需要的那一部分。比如你可以根据你的需要提取2018年所有的销售数据、提取今年销量最大的50件商品的数据、提取地区用户的消费数据……,SQL可以通过简单的命令帮你完成这些工作。
2)数据库的增、删、查、改:这些是数据库最基本的操作,但只要用简单的命令就能够实现,所以你只需要记住命令就好。
3)数据的分组聚合、如何建立多个表之间的联系:这个部分是SQL的进阶操作,多个表之间的关联,在你处理多维度、多个数据集的时候非常有用,这也让你可以去处理更复杂的数据。
4. 如何快速学习数据语言
数据分析的流程,一般大致可以按“数据获取-数据存储与提取-数据预处理-数据建模与分析-数据可视化”这样的步骤来实施一个数据分析项目。
那么高效的学习路径是什么?
小编给大家推荐DataCastle的一个学习方法,就是按照图上数据分析的这个流程来学习。
按这样的顺序循序渐进,你会知道每个部分需要完成的目标是什么,需要学习哪些知识点,哪些知识是暂时不必要的。然后每学习一个部分,你就能够有一些实际的成果输出,有正向的反馈和成就感,你才会愿意花更多的时间投入进去。以解决问题为目标,效率自然不会低。
为了方便大家学习掌握数据语言技能
Mean Value特别推出Data Science训练营
【SQL/Python/R语言精品课程】
课程从实用知识入手
理论与实操相结合
由浅入深,提供数据文件
手把手带你入行