我的编程空间,编程开发者的网络收藏夹
学习永远不晚
位置:首页-资讯-运维

机器学习&数据科学&人工智能等的区别

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

机器学习&数据科学&人工智能等的区别

  欢迎各位阅读本篇,数据科学将会告诉你所需要了解的一切。它富有深刻见解,是根据哥伦比亚大学的数据科学的讲义整理而成。本篇文章讲述了机器学习&数据科学&人工智能等的区别,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!

  因为数据科学是个广义的学科,所以这里将从任何业务里都可能会遇到的数据科学家类型开始,通过这个部分或许你能发现自己隐藏的数据科学家潜质:)正如任何科学学科一样,数据科学家也可能向相关学科学习借鉴,尽管数据科学已经有自己的部分,尤其是自动处理超大规模非结构化数据的方式和算法,甚至不需要人为干涉,就可以做实时处理或者预测。

机器学习&数据科学&人工智能等的区别_机器学习_深度学习_数据科学_编程学习网教育

  1. 数据科学家的各种类型

  想要开始并且了解一些以前的观点,不妨参考2014年发布的文章“ 9 types of data scientists”或者同年另一篇文章比较数据科学和“16 analytic disciplines”。更近一点的(2016八月) Ajit Jaokar 讨论了Analytics data scientist(Type A)和Builder data scientist(Type B)的不同:

  Type A Data Scientists在工作中遇到数据相关时可以写出不错的代码,但是并不必须是专家,这类data scientist可能专业是实验设计、预测、建模、统计推断或者其他统计学研究的典型部分。但是一般而言,数据科学家的工作产出可不是学术统计学有时候建议的那样“p-values and confidence intervals”(正如有时候传统的药物领域统计学家会用到那样)。在Google,Type A Data Scientists通常指统计学家、定量分析师、决策支持技术分析师或者数据科学家,可能还有其他的一些。

  Type B Data Scientists是building data的。B类和A类有些相同的统计学背景,但他们还是更好的coders,可能有专业的软件工程的训练。他们主要对在产品中使用数据感兴趣,他们建立与用户交互的模型,通常是提供推荐的(产品、可能认识的人、广告电影、搜索结果之类)。

  笔者之前还写过 ABCD's of business processes optimization ,D代表data science,C 代表computer science,B代表business science,A代表analytics science。Data Science可能包括也可能不包括写代码或者数学实践,具体可以参考low-level versus high-level data science。在创业公司里,数据科学家通常有几个头衔,比如数据挖掘师、数据工程师或者架构师、研究员、统计员、模型师(预测建模)或者开发者。

  尽管data scientist通常被描述成精通R、Python、SQL、Hadoop和统计学的程序员,但这只是冰山一角,受一些培训机构引导而来。但就像实验技术员可以自称物理学家一样,真正的物理学家远不止这样,而且领域专业知识各种各样:天文学、数学、物理学、核物理、力学、电学、信号处理(也是数据科学的一个子领域)等等。以此类比数据科学家,真正涉及到的领域可能多种多样,生物信息学、信息技术、模拟和质量控制、金融工程、传染病学、工业工程等。

  笔者过去十年致力于主机间以及设备间的通信,建立系统来自动处理大规模数据集,以及执行一些自动交易:比如购买Internet流量或者自动化生成内容。这些都隐藏着非结构化数据算法的开发需求,这也是AI(artificial Intelligence)、IoT(Internet of thing)、和数据科学的交叉部分,被称作深度数据科学( deep data science)。这部分相对而言不需要和数学打交道,敲代码也不多(主要是一些API),但是确实是数据集中的(包括构建数据系统),而且基于专门为此设计的新的统计学方法。

  在这之前,笔者主要做实时信用卡欺诈侦查,而职业生涯早期从事图像遥感技术,即在卫星图像的各种东西中识别出特定的模式(或者形状、特点,比如识别出湖泊)来实现图形分隔:那个时候研究被称作计算统计学,与computer science做相同的事情的人,称呼他们的研究为Artificial Intelligence。今天,同样的研究可能被叫做数据科学或者人工智能了,子领域可能就是信号处理、计算机视觉或者是物联网。

  并且,数据科学家分布在整个data science projects生命周期的任何时刻,在数据收集阶段或者数据探索阶段,一直到统计建模和维系既存的系统。

  2. 机器学习vs. 深度学习

  在深度探讨machine learning和data science的联系之前,这里简要地讨论一下machine learning 和deep learning。machine learning是一套算法,来训练数据集做预测或者采取行动以使得系统最优化。举例来说,supervised classification algorithms被用来根据历史数据将想要贷款的客户分成预期好的和预期差的(good or bad prospects)。对于给定的任务(比如监督聚类),需要的技术多种多样:naive Bayes、SVM、neural nets、ensembles、association rules、decision trees、logistic regression,或者是很多技术的组合。想要了解更详细的算法, click here;了解机器学习的问题, click here。

  所有这些都是数据科学的子集。当这些算法自动化后,比如无人驾驶飞机或者无人驾驶汽车,这就叫AI了,或者说的具体一点,deep learning。 Click here浏览另一篇比较机器学习和深度学习的文章。如果采集的数据来自传感器并且通过互联网传播,那么这就是机器学习或数据科学或深度学习应用于物联网了。

  有些人对深度学习有不同的定义,他们认为深度学习是更深层次的神经网络(一种机器学习的技术)。最近有人在Quora上问这个问题,下面是一些具体的解释(来源是Quora)

  AI(Artificial Intelligence)是创建于20世纪60年代的计算机科学的一个子领域,是关于解决那些对人类来讲非常容易但是对计算机而言很难的任务。值得一提的是,所谓的strong AI可能可以做所有人类可以做的事情(可能除了纯粹的物理问题)。这是相当广泛的,包括各种各样的事情,比如做计划,在世界上到处溜达,识别物体和声音,说话,翻译,社交或者商业交易,还有创造性工作(比如写诗画画)等等。

  NLP(Natural language processing)只是AI要处理的语言部分,尤其是写。

NLP(Natural language processing)只是AI要处理的语言部分,尤其是写。

  Machine learning是这样的一种情况:给出一些可以被以离散形式描述的AI问题(比如从一系列动作中选出对的那个),然后给定一堆外部世界的信息,在不需要程序员手动写程序的情况下选出那个“正确的”行为。通常情况需要借助外界的一些过程来判断这个动作对不对。在数学上,这就是函数:你给一些输入,然后你想要他处理一下得到正确的输出,所以整个问题就简化为用一些自动的方式建立这种数学函数模型。和AI区分一下:如果我写了一段特别机智的程序有着人类的行为,那这就可以是AI,但是除非它的参量都是自动从数据中学会的,否则就不是机器学习。

  Deep learning是当下非常流行的机器学习的一种。它包含一种特殊的数学模型,可以想成是一种特定类型的简单块的组合(或者说是块的功能的组合),这些块可以进行调整来更好的预测最终结果。

  那么,机器学习和统计学的不同?这个文章尝试回答这个问题。作者写到,统计学是有着被预测量或者被评估量的置信区间的机器学习。我倾向于反对,因为我已经建立了不需要任何数学或者统计学知识的工程师友好型置信区间。

  3. Data Science VS Machine Learning

  机器学习和统计学都是数据科学的一部分。Learning这个词在machine learning里意味着依赖于某些数据的算法,被用作一种训练模式集来调整一些模型或者算法参数。这包含很多技术,比如回归、朴素贝叶斯或者监督聚类。但不是所有的技术都适合这个分类。比如,非监督聚类——一种统计学和数据科学的方法——旨在不依靠任何先验知识和训练集监测聚类或聚类结构来帮助分类算法。需要有人来标注被发现的聚类。有些技术是混合的,比如半监督分类。有些模式侦查或者密度评估技术适合这个分类。

  然而数据科学比机器学习范围大得多。数据科学里“data”,可能是也可能不是来自机器或者机械过程的(调查结果可能是人工采集的,临床试验需要一种特殊类型的small data等),而且可能和上面提到的”learning”一点关系也没有。但是主要的不同还是因为数据科学实际上涵盖了整个数据处理的范围,而不只是算法或者统计学方面。

  当然了,在很多组织里,数据科学家只是专注于这个处理过程的一部分。想要了解一下我对数据科学的原创贡献。

  分享:深度机器学习

  技术核心

  “深盟”目前的重点开发项目被命名为“虫洞”,其将成为所有深盟项目的统一入口。虫洞将自动构建深盟所有项目,为对所有组件提供一致的数据流支持,无论数据是以何种格式存在网络共享磁盘,HDFS,还是Amazon S3。

  此外,它还提供统一脚本来编译和运行所有组件,使得用户即可以在方便的本地集群运行任何一个分布式组件,又可以将任务提交到任何一个包括Amazon EC2,Microsfot Azure, Google Compute Engine在内的云计算平台,并提供自动的容灾管理。

  截止目前,“深盟”分布式深度机器学习开源平台的已有组件已成功覆盖三类最常用的机器学习算法,包括被广泛用于排序的决策树模型(GBDT),用于点击预测的稀疏线性模型(如Sparse Logistic Regression),以及目前的研究热点深度学习。

  3研究方向

  未来“深盟”将致力于将实现和测试更多常用的机器学习算法,并通过更好的融合当前各类组件,将提供更为一致性的用户体验。

  资料显示,机器学习是人工智能研究领域中的重要方向,而深度学习则是近年机器学习领域的一个重大突破, 作为目前最接近人脑的智能学习方法,深度学习可以完成需要高度抽象特征的人工智能任务,如语音识别、图像识别和检索、自然语言理解等,有着广泛的应用前景。

机器学习是人工智能研究领域中的重要方向

  在深度学习的研发上,百度一直在布局,早在2013年,其便组建了IDL(深度学习研究院),面向全球延揽一流学术人才,并尝试将深度学习应用于语音识别和图像识别、检索,以及广告CTR预估(Click-Through-Rate Prediction,pCTR)等领域。

  2014年,将Andrew Ng招致麾下,Andrew Ng是斯坦福大学人工智能实验室主任,入选过《时代》杂志年度全球最有影响力100人。百度称,到目前为止,已有8项深度学习技术在产品上线,在用GPU提升计算效率,处理海量训练数据,语音识别,OCR识别,人脸识别,图像搜索等领域均有突破。

  小结:现在人们已经意识到数据可以让选举或者商业模式变得不同,数据科学作为一项职业正在不断发展。但是你应该如何在这样一个广阔而又错综复杂的交叉学科领域中开展工作呢?不妨关注编程学习网教育平台,在这个学习知识的天堂中,您肯定会有意想不到的收获的!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

机器学习&数据科学&人工智能等的区别

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

机器学习&数据科学&人工智能等的区别

欢迎各位阅读本篇,数据科学将会告诉你所需要了解的一切。它富有深刻见解,是根据哥伦比亚大学的数据科学的讲义整理而成。本篇文章讲述了机器学习&数据科学&人工智能等的区别,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
机器学习&数据科学&人工智能等的区别

人工智能深度学习与数据科学

编程学习网:如果您刚开始接触人工智能或数据科学,那么很有可能一遍又一遍地碰到这四个术语。在本文中,您将发现它们的基本含义,并了解它们之间的区别。
人工智能深度学习与数据科学

人工智能数据机器学习在故障检测中的应用

编程学习网:本文将简要介绍几种在故障诊断领域广泛应用的机器学习技术及其各自的应用方向,并对每种技术的优缺点进行简单分析。包括:贝叶斯网络(BN),人工神经网络(ANN),支持向量机(SVM)和隐马尔可夫模型(HMM)技术。
人工智能数据机器学习在故障检测中的应用

人工智能2020年图机器学习的新趋势

编程学习网:2020年才刚刚开始,但我们已经在最新的研究论文中看到了图机器学习(GML)的趋势。以下是我对2020年GML的重要内容的看法以及对这些论文的讨论。
人工智能2020年图机器学习的新趋势

人工智能适合机器学习的三个原因

编程学习网:如今,各种类型的企业都致力于采用人工智能和机器学习项目,但要发挥其真正的潜力,则需要克服重大的技术障碍。虽然计算基础设施通常是重点,但存储设施也同样重要。
人工智能适合机器学习的三个原因

人工智能和机器学习对组织的影响

编程学习网:如今,数字科学对于企业来说,显得愈发地“诱人”。但是若要正确地看待数字科学,我们亟需了解下面一个问题:数字科学到底能为我们的业务发展做什么,不能为我们的业务发展做什么。
人工智能和机器学习对组织的影响

人工智能成为机器学习首选的Python后端

编程学习网:在机器学习开发领域,如果我们纵观全局,撇除所有微小的细节,那么就可以提炼出机器学习开发中的两大不变步骤。
人工智能成为机器学习首选的Python后端

人工智能机器学习的重要趋势是什么?

编程学习网:在竞争日益激烈的技术市场中,从高科技初创公司到全球跨国公司都将人工智能视为关键竞争优势。但是,人工智能行业发展如此之快,以至于很难跟踪最新的研究突破和成就,甚至很难应用科学成果来实现业务成果。
人工智能机器学习的重要趋势是什么?

人工智能进行机器学习的重要性与日俱增

编程学习网:越来越多的传统托管服务提供商也在以不同的能力使用机器学习。他们的客户应该了解并充分利用这些功能。
人工智能进行机器学习的重要性与日俱增

人工智能机器学习如何在不久的将来改变教育

编程学习网:如果你目前在学校或者在教育领域工作,那么对即将到来的变化有所了解是非常必要的。在这篇文章中,我们将探讨机器学习在未来几年改善教育的五种途径
人工智能机器学习如何在不久的将来改变教育

编程热搜

  • 人工智能你要知道的那些事
    编程学习网:早在1g时代我们只能接打电话。2g时代可以打电话发短信,玩早期的qq,但网络十分不稳定。3g时代带给我们很大的改变就是宽带上网,视频通话,看视频,听歌玩游戏。那时的人们认为4g无用,认为不会有什么改变,但当4g出来时我们才发现这是一次质的飞跃。
    人工智能你要知道的那些事
  • 人工智能无人机管制到底有多难?
    编程学习网:近日,一段“重庆网红列车遭无人机撞击逼停”的视频,在网络热传。
    人工智能无人机管制到底有多难?
  • 人工智能与人类
    欢迎各位阅读本篇,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本篇文章讲述了人工智能与人类,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    人工智能与人类
  • 两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
    公共集群的机器负载分布不均衡的问题,业务的查询和流量不可控等各种各样的问题,要节省机器资源就一定会面对这种各种各样的问题,除非土豪式做法,每个业务都拥有自己的机器资源,这里面有很多很多颇具技术挑战的事情。
    两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
  • 关于OpenStack的架构详细讲解
    欢迎各位阅读本篇文章,OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。本篇文章讲述了关于OpenStack的架构详细讲解,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    关于OpenStack的架构详细讲解
  • AI &神经网络
    欢迎各位阅读本篇,本篇文章讲述了AI &神经网络,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。神经网络内容丰富,反映了当前国内外该领域的最新研究成果和动向,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    AI &神经网络
  • 人工智能对于网络安全的优缺点
    编程学习网:如今,产生的数据比以往任何时候都要多。由于数据分析工具的发展,各行各业的组织都更加重视大数据的收集和存储。
    人工智能对于网络安全的优缺点
  • Bash 初学者系列 7:bash 中的条件语句(if else)
    今天我们介绍一下如何在 bash 中使用条件语句。
    Bash 初学者系列 7:bash 中的条件语句(if else)
  • 人工智能机器学习的重要趋势是什么?
    编程学习网:在竞争日益激烈的技术市场中,从高科技初创公司到全球跨国公司都将人工智能视为关键竞争优势。但是,人工智能行业发展如此之快,以至于很难跟踪最新的研究突破和成就,甚至很难应用科学成果来实现业务成果。
    人工智能机器学习的重要趋势是什么?
  • 人工智能为什么会觉得Matplotlib用起来困难?
    编程学习网:Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。
    人工智能为什么会觉得Matplotlib用起来困难?

目录