hadoop异构存储怎么实现
这篇文章主要讲解了“hadoop异构存储怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“hadoop异构存储怎么实现”吧!
什么是hadoop的异构存储
Hadoop在2.6.0版本中引入了一个新特性——异构存储。异构存储关键在于异构2个字,异构存储可以根据各个存储介质读写特性的不同发挥各自的优势,比如最普通的Disk磁盘;而对于热数据而言,可以采用SSD的方式进行存储,这样就能保证高效的读性能,在速率上甚至能做到十倍于或百倍于普通磁盘读写的速度。
目前hadoop支持的存储类型如下:
* RAM_DISK存储在内存
* SSD 存储在固态硬盘
* DISK(default) 存储在普通磁盘(默认)
* ARCHIVE
按照RAM_DISK->SSD->DISK->ARCHIVE的顺序,存取速度由快到慢,单bit存储成本由高到低。
1 命令的使用
0. hdfs storagepolicies -listPolicies(查看支持的存储策略)
hadoop fs -mkdir /data/ssddata(创建目录)
hdfs storagepolicies -setStoragePolicy -path /data/ssddata –policy One_SSD
(将目录设置为一份存在ssd上面,其他的副本存在普通的磁盘上面,以后存储在该文件夹下面的文件的块副本都会存一份在ssd上面)
hdfs storagepolicies -getStoragePolicy -path /data/ssddata(查看该目录的存储策略,结果如下图)
取消设置的存储策略,创建文件的时候默认为unspecified,那么该命令可以将其修改为默认值
hdfs storagepolicies -unsetStoragePolicy -path /data/normal/ip2.txt
hdfs mover [-p <files/dirs> | -f <local file name>],
索引
在数据检索中,给数据添加索引是一个重要环节,传统中关系型数据库大多通过建索引来达到快速检索的效果,OLTP数据库大多是B或者B+树索引。想必大家都知道lucene,它的索引是倒排索引(该概念不再这里叙述),不同的分词使它的全文检索功能很强大。诸如大家熟知的Elasticsearch也是在以lucene做索引引擎。但遗憾的是ES并不支持异构存储,且ES在面临单个分片数据量超大时也会存在瓶颈问题。
感谢各位的阅读,以上就是“hadoop异构存储怎么实现”的内容了,经过本文的学习后,相信大家对hadoop异构存储怎么实现这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341