我的编程空间,编程开发者的网络收藏夹
学习永远不晚
位置:首页-资讯-运维

机器学习从科学项目到商业的计划

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

机器学习从科学项目到商业的计划

  欢迎各位阅读本篇,本篇文章讲述了机器学习从科学项目到商业的计划,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!

  2015年是机器学习技术在学术领域全面成形的一年。具体来讲,在这一年中其不再是一小部分数据科学家们的专利,而开始成为与每个人息息相关的成果——至少在理论上是如此。

机器学习从科学项目到商业的计划_科学_机器学习_系统_编程学习网教育

  而2016年则开启了由理论到实践的征程。机器学习技术的能力与承诺乃至一切与之相关的可能与支持机制,开始更为坚定地进入商业市场并致力于成为主流。

  这股浪潮主要围绕着三大趋势展开:面向机器学习的新型改良工具集、更为强大(且更易于获取)的硬件选项以及更多负责提供各类开源与专有工具的云托管型机器学习“即服务”衍生成果。

  1.新型改良工具集与框架帮助使用者减轻负担

  曾几何时,如果大家希望在应用中使用机器学习技术,则必须自行构建算法。之后,第三方库的广泛出现能够帮助大家节约这种重新发明轮子的被动局面,但仍要求我们投入大量精力以实现其生产能力。而如今,各类出色的框架选项使得机器学习技术成为一种流水线式流程:一端输入数据,而后进行模型训练,即可最终获得可用结果。

  那么是否还存在着比现有数据处理框架更为理想的机器学习实现方案?答案显然是肯定的。为了实现这一目标,Spark这一超高速热门数据框架不仅在2.0版本中进一步提升性能水平,同时亦添加了一套经过调整的机器学习库,旨在更好地补充Spark的新型内部架构。

  另一种趋势同样值得关注:以往的产品虽然处理数据,但却无法直接接入机器学习机制,如今机器学习加速作为一类新型功能开始登场。内存内数据缓存系统Redis不仅能够承担数据库相关处理职责,亦会将Spark支持下的机器学习方案作为应用添加至其新型模块化架构当中。

  第三种快速崛起的趋势在于用于开发机器学习软件的新型技术工具的涌现。有时候其会以全新语言的形式出现,例如Lift语言就专门用于编写可运行在CPU、GPU及其它硬件之上的高速并行算法; 有时候其体现为指向现有语言的工具集,例如强化C/C++应用以使用OpenMP工具集的Milk,其能够显著加快对大数据集的访问速度。

  2. GPU与定制化硬件在云端及其它领域得到快速推广

 GPU与定制化硬件在云端及其它领域得到快速推广

  如果没有极为强大的GPU为其提供计算资源,机器学习根本无法成为现实; 很明显,GPU确实提供了这一代CPU根本无法企及的强大数据处理能力。

  正因为如此,2016年机器学习领域出现了两波与GPU相关的新动向。其一是在机器学习产品中大量出现利用GPU实现加速的方案,包括Spark等各类数据框架。GPU的出色加速能力亦引起了数据库应用产品的注意,特别是那些定位为能够处理大量数据的机器学习型系统。

  第二波GPU相关变革在于,各家大型云服务供应商现在都开始将GPU加速型实例纳入其产品线。凭借云托管型GPU资源,客户们能够轻松购买到充足的处理资源以支撑自身机器学习训练任务,而这一点几乎无法通过传统的内部GPU驱动型机器学习平台构建方式实现。

  Amazon不仅推出了GPU加持型实例,同时亦拿出了更为灵活的方案:大家可以随时添加或者移除实例中的GPU处理资源,而不必直接购买完整的GPU处理型实例。另一方面,谷歌方面也推出其首款GPU加持型实例,允许用户自由添加/移除相关功能。

  微软Azure也在自家云产品线中纳入了GPU类机制,同时暗示称数据中心用户未来将能够迎来更为丰富的可编程硬件选项。作为一类高速可编程硬件,FPGA目前已经在Azure当中被用于实现网络提速,不过微软亦制定了长远计划,旨在利用类似的设备帮助客户处理各类计算密集型应用——例如机器学习。(Amazon方面也酝酿有类似的计划。)

  当然,云端GPU方案也存在自己的弊端:大家可能无法随时获得业界领先的硬件配置。Amazon于今年9月添加新型GPU实例类型时,其仍坚持使用上一代GPU硬件——这可能主要是为了保证提供用户更为熟悉的选项,而非更新但更难于上手的方案。

  3.云托管算法实现机器学习“民主化”,但成本依旧不菲

  “民主化AI”这一说法来自微软公司,软件巨头借此宣传自身使命在于将机器学习资源通过云端交给每一位用户。当然,各大云巨头能够为这一目标而努力绝对是件好事:其提供的工具能够创建出各类智能化软件,并可与API一样轻松得到使用。

  “人工智能即服务”则是另一类实现方法。与其它即服务类方案一样,云服务同样在其中占据重要地位——其不仅负责配置相关系统,同时亦进行模型训练并托管用于训练的对应数据。如果大家目前尚未将数据引入云环境,则可使用各类更为高效的新型解决方案——例如Amazon推出的单车100 PB Snowmobile服务。您没看错,单车的意思是这是一台装载有集装箱的卡车,其中的存储阵列可一次性迁移100 PB数量。

  在大多数情况下,大家可以直接跳过训练流程而直接通过API实现各类功能。此类API强调的是功能的便捷性而非透明性:请求入、结果出。对于多数用户而言,这种能够最大限度减少工作量的解决方案已经足够理想。当然,这也意味着产生结论的机制更不透明。

  为了解决这个问题,大家也可以依赖于您所熟悉的现有工具的云托管版本,利用其中提供的算法与机制。Spark就是这样一款工具,其缔造者(Databricks)以及IBM与微软等第三方服务商都在自己的云环境中提供其托管版本。

  这套方案的优势在于,大家可以选择最适合自身需求的流程。相比之下,黑盒API流程则更适合那些不打算对机器学习方案进行修改,而仅需要处理结果的用户。不过着眼于未来一年,可能会有相当一部分企业希望推出自己的机器学习驱动型解决方案,并努力在这两类处理思路间找到平衡点。

  干货:

  1)机械学习 (Rote learning)

  学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息。如塞缪尔的跳棋程序,纽厄尔和西蒙的LT系统。这类学习系统主要考虑的是如何索引存贮的知识并加以利用。系统的学习方法是直接通过事先编好、构造好的程序来学习,学习者不作任何工作,或者是通过直接接收既定的事实和数据进行学习,对输入信息不作任何的推理。

  2)示教学习 (Learning from instruction或Learning by being told)

  学生从环境(教师或其它信息源如教科书等)获取信息,把知识转换成内部可使用的表示形式,并将新的知识和原有知识有机地结合为一体。所以要求学生有一定程度的推理能力,但环境仍要做大量的工作。教师以某种形式提出和组织知识,以使学生拥有的知识可以不断地增加。这种学习方法和人类社会的学校教学方式相似,学习的任务就是建立一个系统,使它能接受教导和建议,并有效地存贮和应用学到的知识。不少专家系统在建立知识库时使用这种方法去实现知识获取。示教学习的一个典型应用例是FOO程序。

  3)演绎学习 (Learning by deduction)

  学生所用的推理形式为演绎推理。推理从公理出发,经过逻辑变换推导出结论。这种推理是"保真"变换和特化(specialization)的过程,使学生在推理过程中可以获取有用的知识。这种学习方法包含宏操作(macro-operation)学习、知识编辑和组块(Chunking)技术。演绎推理的逆过程是归纳推理。

  4)类比学习 (Learning by analogy)

利用二个不同领域(源域、目标域)中的知识相似性

  利用二个不同领域(源域、目标域)中的知识相似性,可以通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识,从而实现学习。类比学习系统可以使一个已有的计算机应用系统转变为适应于新的领域,来完成原先没有设计的相类似的功能。

  小结:相信最后大家阅读完毕本篇文章,肯定学到了不少知识吧?其实大家私下还得多多自学,当然如果大家还想了解更多方面的详细内容的话呢,不妨关注编程学习网教育平台,在这个学习知识的天堂中,您肯定会有意想不到的收获的!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

机器学习从科学项目到商业的计划

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

机器学习从科学项目到商业的计划

欢迎各位阅读本篇,本篇文章讲述了机器学习从科学项目到商业的计划,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
机器学习从科学项目到商业的计划

编程热搜

  • 人工智能你要知道的那些事
    编程学习网:早在1g时代我们只能接打电话。2g时代可以打电话发短信,玩早期的qq,但网络十分不稳定。3g时代带给我们很大的改变就是宽带上网,视频通话,看视频,听歌玩游戏。那时的人们认为4g无用,认为不会有什么改变,但当4g出来时我们才发现这是一次质的飞跃。
    人工智能你要知道的那些事
  • 人工智能无人机管制到底有多难?
    编程学习网:近日,一段“重庆网红列车遭无人机撞击逼停”的视频,在网络热传。
    人工智能无人机管制到底有多难?
  • 人工智能与人类
    欢迎各位阅读本篇,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本篇文章讲述了人工智能与人类,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    人工智能与人类
  • 两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
    公共集群的机器负载分布不均衡的问题,业务的查询和流量不可控等各种各样的问题,要节省机器资源就一定会面对这种各种各样的问题,除非土豪式做法,每个业务都拥有自己的机器资源,这里面有很多很多颇具技术挑战的事情。
    两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
  • 关于OpenStack的架构详细讲解
    欢迎各位阅读本篇文章,OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。本篇文章讲述了关于OpenStack的架构详细讲解,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    关于OpenStack的架构详细讲解
  • AI &神经网络
    欢迎各位阅读本篇,本篇文章讲述了AI &神经网络,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。神经网络内容丰富,反映了当前国内外该领域的最新研究成果和动向,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    AI &神经网络
  • 人工智能对于网络安全的优缺点
    编程学习网:如今,产生的数据比以往任何时候都要多。由于数据分析工具的发展,各行各业的组织都更加重视大数据的收集和存储。
    人工智能对于网络安全的优缺点
  • Bash 初学者系列 7:bash 中的条件语句(if else)
    今天我们介绍一下如何在 bash 中使用条件语句。
    Bash 初学者系列 7:bash 中的条件语句(if else)
  • 人工智能机器学习的重要趋势是什么?
    编程学习网:在竞争日益激烈的技术市场中,从高科技初创公司到全球跨国公司都将人工智能视为关键竞争优势。但是,人工智能行业发展如此之快,以至于很难跟踪最新的研究突破和成就,甚至很难应用科学成果来实现业务成果。
    人工智能机器学习的重要趋势是什么?
  • 人工智能为什么会觉得Matplotlib用起来困难?
    编程学习网:Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。
    人工智能为什么会觉得Matplotlib用起来困难?

目录