hadoop异构存储怎么实现

2023-06-02 11:55

短信预约 -IT技能 免费直播动态提醒

这篇文章主要讲解了“hadoop异构存储怎么实现”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“hadoop异构存储怎么实现”吧！

什么是hadoop的异构存储

Hadoop在2.6.0版本中引入了一个新特性——异构存储。异构存储关键在于异构2个字，异构存储可以根据各个存储介质读写特性的不同发挥各自的优势，比如最普通的Disk磁盘；而对于热数据而言，可以采用SSD的方式进行存储，这样就能保证高效的读性能，在速率上甚至能做到十倍于或百倍于普通磁盘读写的速度。

目前hadoop支持的存储类型如下：

* RAM_DISK存储在内存

* SSD 存储在固态硬盘
* DISK(default) 存储在普通磁盘（默认）
* ARCHIVE

按照RAM_DISK->SSD->DISK->ARCHIVE的顺序，存取速度由快到慢，单bit存储成本由高到低。

1 命令的使用

0. hdfs storagepolicies -listPolicies（查看支持的存储策略）

hadoop fs -mkdir /data/ssddata（创建目录）

hdfs storagepolicies -setStoragePolicy -path /data/ssddata –policy One_SSD

（将目录设置为一份存在ssd上面，其他的副本存在普通的磁盘上面，以后存储在该文件夹下面的文件的块副本都会存一份在ssd上面）

hdfs storagepolicies -getStoragePolicy -path /data/ssddata(查看该目录的存储策略，结果如下图)

hadoop异构存储怎么实现

取消设置的存储策略，创建文件的时候默认为unspecified，那么该命令可以将其修改为默认值

hdfs storagepolicies -unsetStoragePolicy -path /data/normal/ip2.txt

hdfs mover [-p <files/dirs> | -f <local file name>],

索引

在数据检索中，给数据添加索引是一个重要环节，传统中关系型数据库大多通过建索引来达到快速检索的效果，OLTP数据库大多是B或者B+树索引。想必大家都知道lucene,它的索引是倒排索引（该概念不再这里叙述），不同的分词使它的全文检索功能很强大。诸如大家熟知的Elasticsearch也是在以lucene做索引引擎。但遗憾的是ES并不支持异构存储，且ES在面临单个分片数据量超大时也会存在瓶颈问题。

感谢各位的阅读，以上就是“hadoop异构存储怎么实现”的内容了，经过本文的学习后，相信大家对hadoop异构存储怎么实现这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉