你真的了解数据行业吗?商业领袖认为数据对他们发展业务有帮助!
Dun&Bradstreet 的一项新研究调查了美国和英国的500多名商业决策者,结果显示这些高管中有一半(50%)认为,如果没有高质量的数据,他们的公司将无法生存。商业领袖仍然对数据充满热情,2/3的受访者(67%)认识到数据在帮助他们发展业务方面的潜力。
那么,商业领袖目前使用哪些技术来收集和分析数据,以及他们计划在未来12个月内添加哪些技术?
目前,超过2/5的企业(43%)正在使用数据管理软件,另有1/4(25%)计划明年使用。
只有22%的企业使用机器学习进行数据收集和分析,尽管26%的企业将在未来12个月内转向此类解决方案。
3/10的受访者(31%)计划在明年使用人工智能(AI),21%的受访者已经在使用这项技术。虽然AI的采用速度比它的炒作要慢,但许多使用这种先进技术的B2B营销人员已经看到效果。
区块链和边缘计算技术预计也将在不久的将来得到更多的使用,1/4的受访者(25%)表示他们将使用这两种技术,而目前分别有19%和17%的企业在使用这两种技术。
数据挑战继续存在
近3/10的受访者(28%)认为,有效的数据管理是他们在未来10年将面临的最大数据挑战。这也是他们面临的以数据为主导的最大挑战。
人才仍然很重要
无论数据为企业带来的价值如何,如果没有人来管理它,其价值可能难以实现:受访者中有相当一部分人认为,人才是实现数据价值最大化的关键。
一些高管还承认,现有的技能差距阻碍了他们最大限度地利用数据。但是,拥有正确数据和分析技能的员工越来越难找到。越来越多的人往数据行业发展,大企业也都开始使用大数据,运用人工智能进行各种业务分析和预测。大家都知道大数据是什么,但具体涉及到数据科学和人工智能时,很多人可能一时给不出比较具体的解释说明。
Mean Value小编通过这篇文章想跟大家科普下 Data Science, machine learning, deep learning 还有 artificial intelligence 的关系和区别。
我们先来看看David Robinson,DataCamp首席数据科学家在 『What’s the difference between data science, machine learning, and artificial intelligence?』 一文中给数据科学、机器学习和人工智能三个领域提出的一个简单的定义:
- 数据科学负责见解
- 机器学习负责预测
- 人工智能负责行为
但是David也指出这不是一个充分条件:不是所有符合该定义的东西都是该领域的一部分。但他认为这个定义对区分这三种工作是一种非常有效的方法,并且可以避免你谈论它的时候听起来很傻。
1 Data Science数据科学
数据科学与其他两个领域不同,因为它的目标跟人类的目标尤其接近:获得洞察力和理解力。
同样,并不是所有产生洞察力的都有资格成为数据科学,数据科学的经典定义是它涉及了统计学,软件工程和领域专业知识的组合。但是我们可以利用这个定义来区分它和ML、AI。它们最主要的区别在于,在数据科学循环过程中总需要人参与:由人理解洞察结果,了解大体轮廓,或者从结论中获益。所以像“下棋算法使用数据科学来选择下一步”或者“谷歌地图使用数据科学来推荐驾驶方向”这些说法都是毫无意义的
因此,数据科学的定义强调:
- 统计推断
- 数据可视化
- 实验设计
- 领域知识
- 沟通
数据科学家可能使用一些简单的工具:可以报告百分比,并根据SQL查询结果绘制线形图。还可以使用非常复杂的方法:能够与分散的数据仓库合作,分析数以万亿计的记录,开发最前沿的统计技术,建立交互式可视化。但是不管使用什么,目的都是为了更好地理解数据。
2 Machine Learning机器学习
大体来讲,机器学习就是用算法真正解析数据,不断学习,然后对事件中发生的事做出判断和预测。
正如David所说,几乎所有的Kaggle竞赛都可以被认为是机器学习相关的问题:他们提供一些tranining data,然后看看竞赛者能否对新的例子做出准确的预测。
数据科学和机器学习有很多的重叠之处。例如,都可以用逻辑回归来获取对有关关系的见解(越富裕的人越有可能购买我们的产品,所以我们应该改变我们的营销策略)并且可以做出预测(该用户有53%的几率购买我们的产品,所以我们应该多向他们推销)。
但同时像随机森林(random forests)这样的模型,其可解释性稍差,所以更适合“机器学习”的描述。
大多数的从业者能够非常自在的在两个领域之间来回切换。David举例他在工作中就同时使用了机器学习和数据学习:在Stack Overflow流量数据上安装一个模型,以确定哪些用户可能正在寻找工作(机器学习),然后构建总结和可视化来检验模型的工作原理(数据科学)。这是发现模型缺陷的一个重要方法,也是解决算法偏差的重要方法。所以是数据科学家常常负责开发产品的机器学习组件的原因之一。
3 Artificial intelligence人工智能
人工智能有强人工智能和弱人工智能之分。
“强人工智能(General AI)”,就是打造一台超棒的机器,让它拥有人类的所有感知,甚至还可以超越人类感知,它可以像人一样思考。在电影中我们经常会看到这种机器,比如终结者。
还有一个概念是“弱人工智能(Narrow AI)”。简单来讲,“弱人工智能”可以像人类一样完成某些具体任务,有可能比人类做得更好,例如,Pinterest服务用AI给图片分类,Facebook用AI识别脸部,这就是“弱人工智能”。
人工智能是迄今为止这几种概念里最古老也是最广为人知的,因此定义它也最具有挑战性。但同时这一术语早已被大量的滥用和营销。
图片来自:今日头条
从上图可知,我们可以看到它与其他领域有很多重叠之处。而深度学习横跨了ML和AI两个领域,典型的事例是对数据进行训练,然后生成预测,但在AlphaGo这样的博弈算法中却取得了巨大的成功。
但也有区别。David指出如果分析一些销售数据并发现某个特定行业的客户比其他行业的客户更新的更多,那么输出的是一些数字和图形,而不是指定操作 (高管们可能会用这些结论来调整销售策略,但这种做法并不是自动的)。人工智能和机器学习之间的区别更加微妙,历史上的ML经常被认为是AI的一个分支。但也有人认为,现在的机器学习和人工智能已经不再是从属包含关系了:大多数从事预测问题的人不喜欢把自己描述为人工智能研究员。
关于机器学习、人工智能等等概念上的关系和区别也一直有争议,大家有什么其他意见和看法呢? 欢迎留言!