我的编程空间,编程开发者的网络收藏夹
学习永远不晚

大数据 MongoDB 3.2.1 分片

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

大数据 MongoDB 3.2.1 分片

MongoDB 分片

  • 在Mongodb里面存在另一种集群,就是分片技术,可以满足MongoDB数据量大量增长的需求。

  • 当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。

分片的目的

  高数据量和吞吐量的数据库应用会对单机的性能造成较大压力,大的查询量会将单机的CPU耗尽,大的数据量对单机的存储压力较大,最终会耗尽系统的内存而将压力转移到磁盘IO上。

解决方法 :

有两个基本的方法: 垂直扩展和水平扩展。
  • 垂直扩展:增加更多的CPU和存储资源来扩展容量。

  •  水平扩展:将数据集分布在多个服务器上。水平扩展即分片

分片结构图(图片来源于网络) :

大数据 MongoDB 3.2.1 分片

MongoDB 分片群集的组成(图片来源于网络) :

MongoDB分片群集的三个主要组件:

Shard:
用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个replica set承担,防止主机单点故障

Config Server:
mongod实例,存储了整个 ClusterMetadata,其中包括 chunk信息。

Query Routers:
前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。

大数据 MongoDB 3.2.1 分片

分片群集的简单部署 :

实验环境 :

1台路由实例(端口27017)。
1台配置实例(端口37017)。
2台shard实例(端口47017、47018)。

1.配置配置服务器 :

vim mongodb1.conf

port=37017
dbpath=/data/mongodb/mongodb1
logpath=/data/logs/mongodb1.log
logappend=true
fork=true
maxConns=5000
storageEngine=mmapv1
configsvr=true        #开启配置服务
mongod -f /usr/local/mongodb/bin/mongodb1.conf  #开启配置实例

2.配置分片服务器 :

vim mongodb2.conf

port=47017
dbpath=/data/mongodb/mongodb2
logpath=/data/logs/mongodb2.log
logappend=true
fork=true
maxConns=5000
storageEngine=mmapv1
shardsvr=true    #开启分片服务

vim mongodb3.conf

port=47018
dbpath=/data/mongodb/mongodb3
logpath=/data/logs/mongodb3.log
logappend=true
fork=true
maxConns=5000
storageEngine=mmapv1
shardsvr=true    #开启分片服务

mongod -f /usr/local/mongodb/bin/mongodb2.conf   #开启分片实例
mongod -f /usr/local/mongodb/bin/mongodb3.conf

3.启动路由服务器 :

[root@localhost bin]# ./mongos --port 27017 --fork  --logpath=/usr/local/mongodb/bin/route.log --configdb 192.168.217.134:37017 --chunkSize 1
2018-07-23T14:15:28.185+0800 W SHARDING [main] Running a sharded cluster with fewer than 3 config servers should only be done for testing purposes and is not recommended for production.
about to fork child process, waiting until server is ready for connections.
forked process: 15337
child process started successfully, parent exiting

4.添加分片服务器 :

[root@localhost bin]# mongo
MongoDB shell version: 3.2.1
......
mongos> show dbs
config  0.031GB
mongos> sh.status()      #查看分片状态
--- Sharding Status --- 
  sharding version: {
    "_id" : 1,
    "minCompatibleVersion" : 5,
    "currentVersion" : 6,
    "clusterId" : ObjectId("5b557280f9effb757fd31cdb")
}
  shards:            #分片为空
  active mongoses:
    "3.2.1" : 1
  balancer:
    Currently enabled:  yes
    Currently running:  no
    Failed balancer rounds in last 5 attempts:  0
    Migration Results for the last 24 hours: 
        No recent migrations
  databases:
mongos> sh.addShard("192.168.217.134:47017")   #添加分片
{ "shardAdded" : "shard0000", "ok" : 1 }
mongos> sh.addShard("192.168.217.134:47018")
{ "shardAdded" : "shard0001", "ok" : 1 }

mongos> sh.status()       #查看分片状态
--- Sharding Status --- 
  sharding version: {
    "_id" : 1,
    "minCompatibleVersion" : 5,
    "currentVersion" : 6,
    "clusterId" : ObjectId("5b557280f9effb757fd31cdb")
}
  shards:      #分片信息
    {  "_id" : "shard0000",  "host" : "192.168.217.134:47017" }
    {  "_id" : "shard0001",  "host" : "192.168.217.134:47018" }
  active mongoses:
    "3.2.1" : 1
  balancer:
    Currently enabled:  yes
    Currently running:  no
    Failed balancer rounds in last 5 attempts:  0
    Migration Results for the last 24 hours: 
        No recent migrations
  databases:

4.启用分片服务器 :

mongos> use test
switched to db test
mongos> for(var i=1;i<=10000;i++)db.users.insert({"id":i,"name":"tom"+i})  #添加数据
WriteResult({ "nInserted" : 1 })
mongos> sh.status()  
.......
  databases:
    {  "_id" : "test",  "primary" : "shard0000",  "partitioned" : false }
    #partitioned 值为false 表示数据库尚未分片。

mongos> sh.enableSharding("test")   #启用数据库分片

mongos> db.users.createIndex({"id":1})   #创建索引

mongos> sh.shardCollection("test.users",{"id":1})  #表分片
{ "collectionsharded" : "test.users", "ok" : 1 }
mongos> sh.status()
......
            { "id" : { "$minKey" : 1 } } -->> { "id" : 2341 } on : shard0001 Timestamp(5, 1) 
            { "id" : 2341 } -->> { "id" : 4682 } on : shard0001 Timestamp(3, 0) 
            { "id" : 4682 } -->> { "id" : 7023 } on : shard0000 Timestamp(6, 1) 
            { "id" : 7023 } -->> { "id" : 9364 } on : shard0000 Timestamp(1, 3) 
            { "id" : 9364 } -->> { "id" : 13407 } on : shard0000 Timestamp(3, 2) 
            { "id" : 13407 } -->> { "id" : 21295 } on : shard0000 Timestamp(3, 3) 
            { "id" : 21295 } -->> { "id" : 25976 } on : shard0001 Timestamp(4, 2) 
            { "id" : 25976 } -->> { "id" : 33545 } on : shard0001 Timestamp(4, 3) 
            { "id" : 33545 } -->> { "id" : 38226 } on : shard0000 Timestamp(5, 2) 
            { "id" : 38226 } -->> { "id" : 45910 } on : shard0000 Timestamp(5, 3) 
            { "id" : 45910 } -->> { "id" : { "$maxKey" : 1 } } on : shard0001 Timestamp(6, 0) 
#数据存放在两个分片服务器上即:shard0000、shard0001中。

5.给分片添加标签 :

mongos> sh.status()
......
  shards:
    {  "_id" : "shard0000",  "host" : "192.168.217.134:47017" }
    {  "_id" : "shard0001",  "host" : "192.168.217.134:47018" }
mongos> sh.addShardTag("shard0000","sales00")  #添加标签
mongos> sh.addShardTag("shard0001","sales01")
mongos> sh.status()
......
  shards:
    {  "_id" : "shard0000",  "host" : "192.168.217.134:47017",  "tags" : [ "sales00" ] }
    {  "_id" : "shard0001",  "host" : "192.168.217.134:47018",  "tags" : [ "sales01" ] }

6.删除分片节点 :

mongos> use admin

mongos> db.runCommand({"removeshard":"192.168.217.134:47018"})   #删除分片节点

ps:MongoDB 4以上的版本做分片,需要先把实例做成复制集。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

大数据 MongoDB 3.2.1 分片

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

mongodb怎么对已有的数据分片

在MongoDB中对已有的数据进行分片需要经过以下步骤:创建分片键:首先需要选择一个字段作为分片键,该字段的值会决定数据在哪个分片上存储。可以选择已有的字段作为分片键,也可以创建新的字段作为分片键。启用分片集群:在MongoDB中启用分片集
mongodb怎么对已有的数据分片
2024-04-09

大数据mongodb分表怎么实现

MongoDB分表实现MongoDB分表通过水平划分数据集实现可伸缩性、性能优化和数据管理灵活性。分表步骤包括:确定分片键、创建分片集合、启用分片、分割数据、设置分片器、管理分片和访问分片数据。分表的好处包括可伸缩性、性能优化、高可用性、快速备份和恢复,以及灵活的数据管理。需要注意的缺点有复杂性、查询开销、数据一致性和成本。
大数据mongodb分表怎么实现
2024-04-09

mongodb分片数据恢复的方法是什么

MongoDB分片数据恢复的方法主要有以下几种:1. 使用备份和恢复工具:可以使用MongoDB提供的mongodump和mongorestore工具进行备份和恢复操作。首先使用mongodump将分片集群中的数据备份到文件中,然后使用mo
2023-08-23

详解大数据框架之分区,分桶,分片

在大数据分布式中,分区,分桶,分片是设计框架的重点。此篇就来总结各个框架。

分布式数据库:数据分片,如何存储超大规模的数据?

今天先是详细介绍了分片的原理,以及多种常用的分片技术;而后分析了手动分片与自动分片的区别,要知道数据分片的未来是属于自动分片的。

开源鸿蒙 OpenHarmony 3.2.1 Release 发布,优化分布式数据管理

OpenHarmony 3.2.1 Release 现已上线 Gitee 等平台。当前版本在 OpenHarmony 3.2 release 的基础上,优化分布式数据管理。
开源鸿蒙2024-11-30

MongoDB与大数据处理:构建高性能分布式数据库

本文将介绍一些MongoDB索引优化的指南,帮助用户更好地利用索引来提高查询性能。

php中mongodb怎么实现大数据分页查询

在PHP中使用MongoDB进行大数据分页查询,可以通过使用skip()和limit()方法来实现。示例代码如下:
php中mongodb怎么实现大数据分页查询
2024-04-12

如何使用MongoDB实现数据的复制和分片功能

如何使用MongoDB实现数据的复制和分片功能引言:MongoDB是一个十分流行的NoSQL数据库系统,它具有高性能、可扩展性和可靠性等特点。在大数据时代,数据量的增长是一种常态,因此数据的复制和分片成为了保证数据可靠性和性能的关键功能。本
2023-10-22

如何在MongoDB中实现数据的实时大数据分析功能

如何在MongoDB中实现数据的实时大数据分析功能引言:随着信息化时代的到来,大数据分析逐渐成为企业和组织管理决策的重要工具。MongoDB作为一款流行的非关系型数据库,具备高性能、高可扩展性和灵活的数据模型等优点,成为了大数据分析的不二选
2023-10-22

mongodb怎么导出大量数据

要导出大量数据,可以使用MongoDB的mongodump工具来备份整个数据库或指定集合。以下是使用mongodump导出大量数据的步骤:打开命令行窗口,并进入MongoDB的bin目录(通常在MongoDB的安装目录下的bin目录中)。运
mongodb怎么导出大量数据
2024-05-22

报表连 MongoDB,数据量大报表慢,怎么做分页?

MongoDB 没有关系数据库之类的分页机制,要实现分页查询得硬编码,可以通过实现 Pageable 接口来自定义分页类,具体网上有很多介绍。 硬编码的缺点是实现太复杂了,也不好维护,对报表开发人员的要求有点高。简单一点的方式是使用支持 MongoDB 分批取
报表连 MongoDB,数据量大报表慢,怎么做分页?
2022-01-23

编程热搜

目录