博客 - 最新消息

Data Science求职必备!暑期R语言高阶精品课程!早鸟价倒计时1天!

现在对 R 语言感兴趣的人越来越多

作为一种统计分析软件

广泛应用于生物,医学,电商等数据相关行业

是目前主流数据应用软件之一

很多人都想快速掌握这门发展迅速的编程语言

从而找到一份满意的高薪工作

却不知从何入手

Mean Value给大家准备的 R 语言课程

从浅入深,带你入行

01

R 是什么?

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,是一个用于统计计算和统计制图的优秀工具。它是由新西兰奥克兰大学统计学系的 Ross Ihaka 和 Robert Gentleman 共同创立。1995年采用通用公共许可协议,使之成为免费软件。

02

R 与数据分析及发展前景

R 语言是过去十年中发展最快的编程语言之一。

随着大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。并且随着越来越多的工程背景的人的加入,R语言的使用范围在迅速扩大成长。

不仅仅是统计领域,教育,银行,电商,互联网等等….都在使用R语言。

以下这些公司都在用 R 语言进行数据分析:

资料来源:DataFlair

其中有很多知名大公司,如KPMG(毕马威),HP(惠普),BAIN & COMPANY9贝恩咨询),UBER,BCG(波士顿咨询公司),HSBC(汇丰),J.P.MORGAN(摩根大通),Deloitte(德勤),Morgan Stanley(摩根士丹利)等等……

而随着人们对数据分析要求的进一步增加,R会以更快的脚步继续发展,将成为免费的、开源的、数据分析软件的代名词。

为了方便大家学习掌握R语言技能

Mean Value特别推出【R语言高阶精品课程】

课程从基础知识入手

理论与实操相结合

由浅入深,提供数据文件

没基础也可以开始学习

手把手带你入行

导师介绍 Edison

统计和信息系统专业PhD

美东地区在职 统计学专业 大学教授

擅长R,Python等数据分析语言,教学经验丰富

RateMyProfessors.com上教学评价均分4.5

课程设计

Lecture 1: Prediction vs. Explanation

1. How to choose model to use

2. Explanation & prediction

3. Predictive modeling

4. Modeling process & evaluation

5. Intro of neural nets

Lecture practice: Neural network in R

Lecture 2: Data mining process

1. Training-Validation-Testing

2. How to choose data mining methods and apply them

3. Overfitting

4. Types of ensemble methods (bagging, boosting, random forests)

5.  Adaptive boosting

6.  Which algorithm is the best?

Lecture practice: Home diabetes patient data 

Lecture 3: Network Analysis

1. What is network

2. Network types & Characteristics

3. ER graphs, Watts–Strogatz Small World Model

4. HITS Algorithm: Hubs and Authorities

5. Graph dynamics

Lecture practice: graph analysis in R 

Lecture 4: Text Mining

1. Concept and method of TM

2. Application domains

3. Bag-of-words representation of text

4. Vector Space Model, topic modeling, & LDA process 

Lecture practice: text mining in R

Lecture 5: Anomaly Detection (unsupervised techniques) & Clustering

1. Methods: self-supervision, clustering-based methods, distance metric-based methods

2. Clustering: Hierarchical & K-means

3. Advantages and disadvantages of different algorithms Lecture practice: Phoenix Reviews dataset

课程咨询

扫描上方二维码回复【R语言】咨询报名

R 值得推荐的特性

03

R  语言有哪些独特的优势?

世界上最大的技术专业协会 IEEE 在几年前已经创建了一个编程语言排名。 IEEE 的排名系统使用一组 12 个指标,包括比如谷歌的搜索量、谷歌的趋势、Twitter 的点击次数、GitHub 的库、Hacker News 的帖子等等。

他们将几十种编程语言进行排名和分类。在他们对 2018 年顶级编程语言的回顾中,R 语言排在第 7 位。

资料来源:ieee.org

著名数据科学网站 KDnuggets 发布了 2018 年数据科学和机器学习工具调查结果。超过 2000 人对自己「过去 12 个月内在项目开发中使用过的数据挖掘/机器学习工具和编程语言」进行了投票。R 语言位列第 3 位。

资料来源:KDnuggests

  • 多数商业统计软件价格不菲,投入成千上万美元都是可能的。而R是免费的。
  • R是一个全面的统计研究平台,提供了各式各样的数据分析技术。几乎任何类型的数据分析工作皆可在R中完成。
  • R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。
  • R是一个可进行交互式数据分析和探索的强大平台。
  • 从多个数据源获取并将数据转化为可用的形式,R也可以直接从网页、社交媒体网站和各种类型的在线数据服务中获取数据。
  • 易于扩展,并为快速编程实现新方法提供了一套十分自然的语言。
  • R的功能可以被整合进其他语言编写的应用程序,包括C++、Java、Python、PHP、Pentaho、SAS和SPSS。这让你在继续使用自己熟悉语言的同时在应用程序中加入R的功能。
  • R可运行于多种平台之上,包括Windows、UNIX和Mac OS X。

04

R 语言的应用范围

R语言作为统计学一门语言,一直在小众领域成长着,最早只有统计学家在用R语言,在各种不同的领域,包括:

  • 统计分析:包括统计分布,假设检验,统计建模
  • 金融分析:量化策略,投资组合,风险控制,时间序列,波动率
  • 数据挖掘:数据挖掘算法,数据建模,机器学习
  • 互联网:推荐系统,消费预测,社交网络
  • 生物信息学:DNA分析,物种分析
  • 生物制药:生存分析,制药过程管理
  • 全球地理科学:天气,气候,遥感数据
  • 数据可视化:静态图,可交互的动态图,社交图,地图,热图,与各种Javascript库的集成。

现在,它有了更多的实际应用。

1. 数据科学

“哈佛商业评论”将数据科学家命名为“21世纪最性感的工作”。Glassdoor将其命名为2016年的“年度最佳工作”。数据科学是一个没有其他方法可以追溯到的领域。

简单的解释说,数据科学家是一位具有额外资产的统计学家:计算机编程技能。 R 语言可以让科学家们能够实时收集数据,执行统计和预测分析,创建可视化和向利益相关者传达可行动的结果。

2. 机器学习

R 语言已经在预测分析和机器学习中发现了很多用途。它具有用于常见 ML 任务的各种包,如线性和非线性回归,决策树,线性和非线性分类等等。

从机器学习爱好者到研究人员的每个人都可使用 R 语言来实现机器学习算法,如金融,遗传学研究,零售,营销和医疗保健等领域。


3. 统计计算

R 语言是统计学家中最流行的编程语言。 事实上,它最初是由统计学家为统计学家建立的。它有一个丰富的软件包存储库,拥有超过9100个软件包,您可以用于计算每个统计功能。

R 语言的表达语法允许研究人员:即使是来自非计算机科学背景的研究人员,可以从各种数据源快速导入,清理和分析数据。


R语言还具有图表功能,这意味着您可以绘制数据并从任何数据集创建有趣的可视化图形。

例如查看我国各地空气质量:

效果展示:

2018© Copyright - Mean Value Consulting