我的编程空间,编程开发者的网络收藏夹
学习永远不晚

对于“大数据”的15条干货思考分享

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

对于“大数据”的15条干货思考分享

  具体来说,要实现大数据的核心价值,还需要前两个重要的步骤,第一步是通过“众包”的形式收集海量数据,第二步是通过大数据的技术途径进行“全量数据挖掘”,最后利用分析结果进行“资源优化配置”。本篇文章讲述了关于“大数据”的15条干货分享,认真阅读肯定会学习到非常有用的知识的,大家快认真阅读吧~

      1.马云创造了“DT”(大数据时代)这个词,说未来社会不是IT时代,而是DT时代,而阿里巴巴战略定位为做DT时代的基础设施。类似于IT时代的微软,移动互联网时代的苹果之类的意思。马云去年在云栖大会上提出未来30年的“五个新”,分别是“新零售,新制造,新金融,新技术,新能源”,其中“新能源”就是大数据,其讨论的相对比较少,似乎公众只关心的是公民数据安全问题,对于产业方面的大数据觉得比较抽象,实际上真正的“大数据”与阿里战略更为密切。

对于“大数据”的15条干货思考分享_数据_系统_互联网_编程学习网教育

  大数据特点:

  大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。《计算机学报》刊登的“架构大数据:挑战、现状与展望”一文列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍,对未来研究做了展望。

业界将其归纳为4个“V”——Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(价值密度低)。

      大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,处理速度快,1秒定律,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。第四,只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。业界将其归纳为4个“V”——Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(价值密度低)。

  从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。

大数据最核心的价值就是在于对于海量数据进行存储和分析。

     大数据最核心的价值就是在于对于海量数据进行存储和分析。相比起现有的其他技术而言,大数据的“廉价、迅速、优化”这三方面的综合成本是最优的。

      2. 最早把大数据应用在商业上的是亚马逊,直接根据用户的阅读兴趣推荐与之相关书籍,人家在PC时代就这么干了,是《大数据时代:生活、工作与思维大变革》一书中的经典案例;而在无线互联网时代的,今日头条根据用户阅读点击行动来形成个性化标签的“千人千面”,成为应用用户大数据的新样板;二者之间是不是有一些相似呢?

  3. 手机正把一切都数据化,自从苹果做机身一体化以外,现在国产手机的电池都不可拆卸了,即使手机关机,也可以定位到,这个功能给军事、刑侦带来便利,比如以前儿童走失寻回机率很小,如今有了跟踪功能,大家看支付宝、滴滴出行、今日头条会推动这一方面消息成功率明显提升了很多,对犯罪分子具有很强的威慑力,很多岗位因为数据的力量实际上更加“实证化”了,在这种局面下,做一个好人会更多回报,而做一个坏人会得到更大的惩罚,这是社会昌明的前兆。

  4. 手机里的数据可以实时上传到“云”上,如果数据没有“在线”,就不是所谓的大数据,而大数据与“云服务”是孪生兄弟,数据在线化需要存储、访问、下载,以前做数据存储是追求存储的空间大,就像手机的内存、电脑的硬盘、机房的服务器一样,当一切都数据化之后,盲目追求物理存储量显然行不通了,所以要转上“云”,也就是在线化了,(听说这个与“马云”爸爸的名字相关)。要用“在线”的思维去理解大数据,而不是停留在海量的直观上。

  5. 云服务也是亚马逊的AWS最早做公有云,IT企业不必向以前自建机房了,使用亚马逊的云服务,等于亚马逊为大家建了一个云服务的平台,这也就从IaaS(基础即服务)转向了PaaS(应用即服务)。在亚马逊做了云服务之后,阿里也做了阿里云,比如我所了解的智能锁品牌果加+、曼申、小嘀等,都是使用阿里云的服务,很多的SaaS软件也是购买的阿里云,阿里云目前稳坐企业服务市场的头把交椅,形成了网络效益。

  6. SaaS(企业即服务软件)之所以火也与云服务相关,是在移动端可以直接下载App软件,有的连PC端系统都没有了,SaaS与ERP的区别是,SaaS是云端化下载、再安装,产品也更加标准化;而此前的ERP是固定的装机。现在SaaS比较多,似乎每个职能部门都有对立的SaaS,以便于提升创业者的人效。缺点是SaaS实在太多,有些碎片化,应该会出现一个类似微信一样的“统一型的企业软件”,成为企业管理中的“瑞士军刀”,看在阿里是有to B的基因上,我大胆预测是阿里钉钉。

  7. 一切都在数据化,并不是意味着所有的数据都有用,比如百度积累了很多年的搜索数据,需要“结构化”之后才能定向地分发信息;百度糯米的O2O数据目前的商业价值,还没有完全释放出来,还需要“云计算”能力跟上来。几乎所有的应用Push信息都比较烦人,说明大数据的场景化还很不成熟。

  8. 除了积累数据之外,互联网巨头都在疯狂购买或兼并数据,目前,现在数据的流通和交换还处于相对初期的阶段。数据使用之后可以不像实物会折旧损耗,还可以继续用,其数据结构化更强,反而增加了价值。目前市场上的数据很多还是在咨询公司或互联网公司手中,并没有很好发挥数据共享的作用,总体来看,数据的壁垒和鸿沟还很大。

  9. 要想首先解决数据开放问题,指望互联网公司开放似乎不大现实,人家的数据积累的好辛苦,都是资本的血汗钱。可行的是政府把自己的大数据开放出来,比如启信宝就是把工商税务数据进行结构化分类,产品体验做好形成了一个很实用的App;当然政府的数据有些涉密,所以推动起来还得看这次两会之后能否有指导文件出台。一旦医疗卫生、交通安全、能源化工之类的大数据公布其含金量将会比互联网数据更大,不过处在“原矿”阶段,还需要专业化团队开发,比如浪潮集团与很多地方政府进行政务云合作就是为了开发政府大数据的巨大潜能。

  10. 数据要想发挥作用,数据资源只是前提,核心还是“云计算”能力,最关键的是看应用的场景;也许这些数据放在这儿没有用,但是在另外的地方却是宝贝,因而应该会出现一个类似淘宝一样的C2C数据交易平台,我有需要的数据找有的人买;而你有的数据我正好需要;而数据之间的流通都是可以在移动端直接进行支付的,反正货币本质上也是数字。这样的大数据平台也许是一种全新的电商(线上交易)平台,今年两会孙丕恕代表有提到发展“数商”的重要理念。

  11. 大数据越来越成为TMT行业发力的起点,如果创业者掌握没有数据就没有办法照亮消费者,也没有办法去回溯生产端进行C2B(定制生产);在这点上,数据开始回顾到了市场营销(Marketing)的本质,满足用户的需求,所以大数据最早爆发的领域是在精准营销或者数字营销上;直接服务于互联网公司的广告销售;尤其是目前创业流量成本越来越高,广告投放精准化需要有程序化平台做专业投放;目前百度做人工智能就是主要以数字营销为发力点。

  12. 人工智能(AI)是一个与“移动互联网”、“互联网+”相媲美的大风口,但是人工智能必须要有大数据作为训练素材,机器学习、深度学习需要有大数据提升其机器人的学习能力。比如如果没有消费场景的大数据,就没有办法做出商业智能;如果没有医疗方面的大数据,就做不出智慧医生。鉴于目前的大数据产业本身还没有火起来,阿星认为AI近几年不可能迅速引爆,处于早期阶段。但是人工智能概念的热炒、资本大量涌入,为大数据交易平台的出现以及数据购买带来钱景相当可观的增量,反而促进了大数据产业开始受重视。

  13. 大数据把人都“标签化”了,以前互联网公司数据对立的都是ID(账户)数据,但是很难接近真人的数据,如今最能真实反映人的数据还是阿里和腾讯,让以前无数多、散、匿、杂的数据越来越集中,越来越接近真人;而用户也可以跳出物理范畴去延伸线上的世界,人与人之间的信任成本降低,陌生人之间的线上交易形成一个相对良好的契约基础,这就是大数据所给予我们的第一波红利。

  14. 可以预料,国内的大数据产业将与欧美完全不同,国外讲究个人隐私,有严格的反隐私法的规定;并且东亚文化圈对上网“隐私”容忍度很高,相关法律机制也不健全,也给了一些大数据公司和互联网用数据牟利带来了“空间”,这有点像互联网行业早期发展与国内知识产权相对宽松氛围相关,整个行业抄去抄来,网民无版权意识用免费内容用惯了。但如果在互联网行业已经成熟的今天,还在吃法律不健全的红利显然比较low了。

  15. 大数据是把双刃剑,公民的数据信息必须得依法监管,如果一旦出现行业性数据安全泄密事件,将会相关新的新行业将陷入危机之中;如智能家居数据泄密将会造成人身财产安全隐患;比如在3月10日曝出一起某互联网公司员工人盗取50亿条公民数据的信息;这是DT崛起前最大的绊脚石;也从侧面证明了大数据产业所处的原始混乱状态。

     小结:很多同学可能会说大数据的核心是数据挖掘,是分布式存储,是NLP,是深度学习,但这一切其实只是大数据的技术途径,大数据的终极核心价值就在于“资源优化配置”。相信大家阅读完毕学到不少的知识吧?当然如果大家还想了解更多关于这方面的详细内容的话,请登录编程学习网教育平台资讯~

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

对于“大数据”的15条干货思考分享

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

对于“大数据”的15条干货思考分享

编程学习网:马云创造了“DT”(大数据时代)这个词,说未来社会不是IT时代,而是DT时代,而阿里巴巴战略定位为做DT时代的基础设施。类似于IT时代的微软,移动互联网时代的苹果之类的意思。马云去年在云栖大会上提出未来30年的“五个新”,分别是“新零售,新制造,新金融,新技术,新能源”,其中“新能源”就是大数据,其讨论的相对比较少,似乎公众只关心的是公民数据安全问题,对于产业方面的大数据觉得比较抽象,实际上真正的“大数据”与阿里战略更为密切。
对于“大数据”的15条干货思考分享
2024-04-23

编程热搜

  • Mysql分表查询海量数据和解决方案
    众所周知数据库的管理往往离不开各种的数据优化,而要想进行优化通常我们都是通过参数来完成优化的。那么到底这些参数有哪些呢?为此在本篇文章中编程学习网笔者就为大家简单介绍MySQL,以供大家参考参考,希望能帮助到大家。以上就是关于大数据的知识点了。喜欢的可以分享给你的朋友,也可以点赞噢~更多内容,就在编程学习网!
    Mysql分表查询海量数据和解决方案
  • 大数据的妙用及17年趋势
    2017年,支持大量结构化和非结构化数据的系统将继续增长。市场需要数据平台来帮助数据管理人员管理和保护大数据,同时允许最终用户进行数据分析。这些系统将逐步成熟,在企业内部的IT系统中更好地运行。所以,我们更要了解大数据!互联网普及使得网民的行为更加多元化,通过互联网产生的数据发展更加迅猛,更具代表性。互联网世界中的商品信息、社交媒体中的图片、文本信息以及视频网站的视频信息,互联网世界中的人与人交互信息、位置信息等,都已经成为大数据的最重要也是增长最快的来源。大家都了解到了吗!更多内容就在编程学习网哟
    大数据的妙用及17年趋势
  • 5G大数据时代空降来袭
    欢迎各位阅读本篇文章,本文主要讲了5G大数据时代。如今 5G 概念已不再陌生,按照行业认同的说法:2017年至2018年 5G 将在国内开始有序测试,2019年进行预商用。工信部之前已表示,中国将在2020年启动 5G 商用。编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    5G大数据时代空降来袭
  • es详解-原理-从图解构筑对es原理的初步认知
    在学习ElasticSearch原理时,我推荐你先通过官方博客中的一篇图解文章(虽然是基于2.x版本)来构筑对ES的初步认知(这种认识是体系上的快速认知)。ES详解 - 原理:从图解构筑对ES原理的初步认知前言图解ElasticSearch图解LuceneSegmentInverted IndexStored Fiel
    es详解-原理-从图解构筑对es原理的初步认知
  • elasticsearch-wrapperquery
    在工作中遇到ElasticSearch版本升级时出现Java High Level接口变更导致的兼容性问题: 之前使用的是2.4.x,考虑性能和功能的增强,需要更换为6.4.x; 2.4.x中我们使用DSL语句直接查询(数据的不确定性和方便动态建立查询规则等因素),而新的ES Java 高阶API中去掉了相关接口的支持
    elasticsearch-wrapperquery
  • 学习大数据营销思维(下)
    编程学习网: 其实,通过上面的介绍,我们知道苹果通过各类产品与服务销售相互促进以理及薄利多销的方式来盈利第二种战略联盟类型是合作方的共同赢利。苹果公司打造了一个参与方共同受益的业务系统。
    学习大数据营销思维(下)
  • 纯干货:HLS 协议详解及优化技术全面解析
    编程学习网:HLS (HTTP Live Streaming), 是由 Apple 公司实现的基于 HTTP 的媒体流传输协议。他跟 DASH 协议的原理非常类似,通过将整条流切割成一个小的可以通过 HTTP 下载的媒体文件,然后提供一个配套的媒体列表文件给客户端,让客户端顺序地拉取这些媒体文件播放, 来实现看上去是在播放一条流的效果。HLS 目前广泛地应用于点播和直播领域。
    纯干货:HLS 协议详解及优化技术全面解析
  • 关于Python 代码全面分析
    欢迎各位阅读本篇,Python(KK 英语发音:/ˈpaɪθən/)是一种面向对象、直译式计算机程序设计语言。本篇文章讲述了关于Python 代码全面分析。
    关于Python 代码全面分析
  • es详解-原理-es原理之索引文档流程详解
    ElasticSearch中最重要原理是文档的索引和文档的读取,本文带你理解ES文档的索引过程。ES详解 - 原理:ES原理之索引文档流程详解文档索引步骤顺序单个文档多个文档文档索引过程详解整体的索引流程分步骤看数据持久化过程深入ElasticSearch索引文档的实现机制写操作的关键点Lucene的写Elastics
    es详解-原理-es原理之索引文档流程详解
  • 五大“网管”必备的网络数据分析工具
    是不是在为如何分析统计网络数据和流量烦恼呢?想不想监控、运维、排障轻松一些?下面给大家提供一些免费网络分析工具,以帮助大家更好的掌控自己的网络!编程学习网教育
    五大“网管”必备的网络数据分析工具

目录