我的编程空间,编程开发者的网络收藏夹
学习永远不晚

MongoDB知识点总结

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

MongoDB知识点总结

MongoDB知识点总结

一:MongoDB 概述
    一、NoSQL 简介

       1. 概念:NoSQL(Not Only SQL的缩写),指的是非关系型数据库,是对不同于传统的关系型数据库的数据库管理系统的统称。用于超大规模数据的存储,数据存储不需要固定的模式,无需多余操作就可以横向扩展。

       2. 特点

           1. 优点:具有高可扩展性、分布式计算、低成本、架构灵活且是半结构化数据,没有复杂的关系等。

           2. 缺点:没有标准化、有限的查询功能、最终一致是不直观的程序等。

 

       3. 分类

         

             

 

       4. NoSQL 和 RDBMS 的对比

          

 

    二、MongoDB 简介

       1. 概念:MongoDB 是由C++语言编写的一个基于分布式文件存储的开源文档型数据库系统。

       2. 功能:JSON 文档模型、动态的数据模式、二级索引强大、查询功能、自动分片、水平扩展、自动复制、高可用、文本搜索、企业级安全、聚合框架MapReduce、大文件存储GridFS。

           1. 面向集合文档的存储:适合存储Bson(json的扩展)形式的数据;

           2. 格式自由,数据格式不固定,生产环境下修改结构都可以不影响程序运行;

           3. 强大的查询语句,面向对象的查询语言,基本覆盖sql语言所有能力;

           4. 完整的索引支持,支持查询计划;

           5. 使用分片集群提升系统扩展性;

 

       3. 适用场景

           1. 网站数据:Mongo非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。

           2. 缓存:由于性能很高,Mongo也适合作为信息基础设施的缓存层。在系统重启之后,由Mongo搭建的持久化缓存层可以避免下层的数据源 过载。

           3. 在高伸缩性的场景,用于对象及JSON数据的存储。

           

 

       4. 数据类型

           

 

    三、概念详解

       1. 数据库:MongoDB 默认的数据库为"db",该数据库存储在data目录中。单个实例可以容纳多个独立的数据库,每一个都有自己的集合和权限,不同的数据库也放置在不同的文件中。

       2. 集合:集合就是 MongoDB 文档组,类似于 RDBMS 的表格。集合存在于数据库中,集合没有固定的结构,这意味着你在对集合可以插入不同格式和类型的数据,但通常情况下我们插入集合的数据都会有一定的关联性。

       3. 文档:一个键值(key-value)对(即BSON)。MongoDB 的文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型,这与关系型数据库有很大的区别,也是 MongoDB 非常突出的特点。

       

        

 

    四、安装配置

       1. Windows

           1. 下载(4.2.7版本以上)并直接安装

              

 

           2. 配置环境变量

               

 

           3. 测试

                 

=

       2. Linux

           

 1  # 解压到指定目录
 2  tar -zxvf mongodb-linux-x86_64-rhel70-4.2.7.tgz -C /opt/
 3  
 4  # 配置环境变量
 5  # MONGODB_HOME
 6  export MONGODB_HOME=/opt/mongodb-linux-x86_64-rhel70-4.2.7
 7  export PATH=$PATH:$MONGODB_HOME/bin
 8  
 9  # 测试
10 [root@controller ~]# mongo
11  MongoDB shell version: 4.2.7
12  connecting to: test

 

二:MongoDB CLI 

    一、增删改

        

 

    二、操作符

        

 

    三、查询

       1. 基本操作

           

 

       2. 聚合查询

           

 

       3. 管道操作:MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理

           

 

    五、管理

        

         

 

    六、索引和高可用

       1. 索引

简介
作用:索引通常能够极大的提高查询的效率,如果没有索引,MongoDB在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。索引主要用于排序和检索。
MongoDB使用 ensureIndex() 方法来创建索引,ensureIndex()方法基本语法格式如下所示:
  db.collection.createIndex(keys, options)
  语法中 Key 值为要创建的索引字段,1为指定按升序创建索引,如果你想按降序来创建索引指定为-1,也可以指定为hashed(哈希索引)。

索引属性:
    background:是否后台构建索引,在生产环境中,如果数据量太大,构建索引可能会消耗很长时间,为了不影响业务,可以加上此参数,后台运行同时还会为其他读写操作让路,这个建议配置为true开启,这样来提高效率。

    unique:是否为唯一索引

索引类型:
    单键索引:
        在某一个特定的属性上建立索引,例如:db.users. createIndex({age:-1});
        1,mongoDB在ID上建立了唯一的单键索引,所以经常会使用id来进行查询;
        2,在索引字段上进行精确匹配、排序以及范围查找都会使用此索引;

    复合索引:
        在多个特定的属性上建立索引,例如:db.users. createIndex({username:1,age:-1,country:1});
        1,复合索引键的排序顺序,可以确定该索引是否可以支持排序操作;
        2,在索引字段上进行精确匹配、排序以及范围查找都会使用此索引,但与索引的顺序有关;
        3,为了性能考虑,应删除存在与第一个键相同的单键索引

    多键索引:
        在数组的属性上建立索引,例如:db.users. createIndex({favorites.city:1});

    哈希索引:
        不同于传统的B-树索引,哈希索引使用hash函数来创建索引。
        1,在索引字段上进行精确匹配,但不支持范围查询,不支持多键hash;
        2,Hash索引上的入口是均匀分布的,在分片集合中非常有用;

优化
1,开启内置的查询分析器,记录读写操作效率:
    db.setProfilingLevel(n,{m}),n的取值可选0,1,2;
        0是默认值表示不记录;
        1表示记录慢速操作,如果值为1,m必须赋值单位为ms,用于定义慢速查询时间的阈值;
        2表示记录所有的读写操作;

2,分析慢速查询
    就是查看执行计划,使用explain分析慢速查询。
    explain的入参可选值为:
        "queryPlanner":是默认值,表示仅仅展示执行计划信息;
        "executionStats":表示展示执行计划信息同时展示被选中的执行计划的执行情况信息;
        "allPlansExecution":表示展示执行计划信息,并展示被选中的执行计划的执行情况信息,还展示备选的执行计划的执行情况信息

3,合理建立索引
    建立索引的规则:
        1,索引很有用,但是它也是有成本的——它占内存,让写入变慢;
        2,mongoDB通常在一次查询里使用一个索引,所以多个字段的查询或者排序需要复合索引才能更加高效;
        3,复合索引的顺序非常重要,例如此脚本所示:
        4,在生成环境构建索引往往开销很大,时间也不可以接受,在数据量庞大之前尽量进行查询优化和构建索引;
        5,避免昂贵的查询,使用查询分析器记录那些开销很大的查询便于问题排查;
        6,通过减少扫描文档数量来优化查询,使用explain对开销大的查询进行分析并优化;
        7,索引是用来查询小范围数据的,不适合使用索引的情况:
            1,每次查询都需要返回大部分数据的文档,避免使用索引
            2,写比读多

    优化目标:
        1,根据需求建立索引
        2,每个查询都要使用索引以提高查询效率, winningPlan. stage 必须为IXSCAN ;
        3,追求totalDocsExamined = nReturned

 

       2. 高可用

1,可复制集
    可复制集是跨多个MongDB服务器(节点)分布和维护数据的方法。mongoDB可以把数据从一个节点复制到其他节点并在修改时进行同步,集群中的节点配置为自动同步数据;旧方法叫做主从复制,mongoDB 3.0以后推荐使用可复制集;
    作用:
        1,避免数据丢失,保障数据安全,提高系统安全性;
            (最少3节点,最大50节点)
        2,自动化灾备机制,主节点宕机后通过选举产生新主机;提高系统健壮性;
            (7个选举节点上限)
        3,读写分离,负载均衡,提高系统性能;
        4,生产环境推荐的部署模式;
    原理:
        数据同步:从节点与主节点保持长轮询;1.从节点查询本机oplog最新时间戳;2.查询主节点oplog晚于此时间戳的所有文档;3.加载这些文档,并根据log执行写操作;
        阻塞复制:与writeconcern相关,不需要同步到从节点的策略(如: acknowledged Unacknowledged 、w1),数据同步都是异步的,其他情况都是同步;
        心跳机制:成员之间会每2s 进行一次心跳检测(ping操作),发现故障后进行选举和故障转移;
        选举制度:主节点故障后,其余节点根据优先级和bully算法选举出新的主节点,在选出主节点之前,集群服务是只读的;
    注意:
        MongoDB复制集里Primary节点是不固定的,所以生产环境千万不要直连Primary。

2,分片集群
    分片是把大型数据集进行分区成更小的可管理的片,这些数据片分散到不同的mongoDB节点,这些节点组成了分片集群。
    作用:
        1,数据海量增长,需要更大的读写吞吐量:存储分布式
        2,单台服务器内存、cpu等资源是有瓶颈的:负载分布式
    注意:分片集群是个双刃剑,在提高系统可扩展性和性能的同时,增大了系统的复杂性,所以在实施之前请确定是必须的。
    容易发生的状况:
        请求分流:通过路由节点将请求分发到对应的分片和块中;
        数据分流:内部提供平衡器保证数据的均匀分布,数据平均分布式请求平均分布的前提;
        块的拆分:3.4版本块的最大容量为64M或者10w的数据,当到达这个阈值,触发块的拆分,一分为二;
        块的迁移:为保证数据在分片节点服务器分片节点服务器均匀分布,块会在节点之间迁移。一般相差8个分块的时候触发;
        
    分片注意点:
        热点 :某些分片键会导致所有的读或者写请求都操作在单个数据块或者分片上,导致单个分片服务器严重不堪重负。自增长的分片键容易导致写热点问题;
        不可分割数据块:过于粗粒度的分片键可能导致许多文档使用相同的分片键,这意味着这些文档不能被分割为多个数据块,限制了mongoDB均匀分布数据的能力;
        查询障碍:分片键与查询没有关联,造成糟糕的查询性能。 
    建议:
        1,不要使用自增长的字段作为分片键,避免热点问题;
        2,不能使用粗粒度的分片键,避免数据块无法分割;
        3,不能使用完全随机的分片键值,造成查询性能低下;
        4,使用与常用查询相关的字段作为分片键,而且包含唯一字段(如业务主键,id等);
        5,索引对于分区同样重要,每个分片集合上要有同样的索引,分片键默认成为索引;分片集合只允许在id和分片键上创建唯一索引;

 

三:MongoDB API

    一、

    二、

    三、

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

MongoDB知识点总结

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

MongoDB知识点总结

一:MongoDB 概述    一、NoSQL 简介       1. 概念:NoSQL(Not Only SQL的缩写),指的是非关系型数据库,是对不同于传统的关系型数据库的数据库管理系统的统称。用于超大规模数据的存储,数据存储不需要固定的模式,无需多余操作
MongoDB知识点总结
2019-04-03

MySQL知识点总结

MySQL知识点总结一、      MySQL常用命令启动MySQL服务:service mysqld start 或 systemctl start mysqld.service停止MySQL服务:service mysqld stop 或 systemct
MySQL知识点总结
2019-07-01

Python知识点总结

本篇内容介绍了“Python知识点总结”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1. 为什么要使用描述符?假想你正在给学校写一个成绩管理
2023-06-16

数据库知识点总结 -

目录数据库介绍SQLSQL定义SQL的分类:DDL(数据定义语言:操作数据库和表)DML(数据操纵语言:操作数据(增删改))DQL(查询表中的数据记录)(重点)视图事务数据库介绍数据库DataBase:用于存储和管理数据的仓库特点:持久化存储数据,数据库就是一
数据库知识点总结 -
2021-05-02

前端知识点总结——HTML

前端知识点总结——HTMLHTML:HTML4.01 指的就是网页技术HTML5:HTML4.01的升级版本1.web的基础知识web与Internet1.Internet:全球性的计算机互联网络,因特网,互联网,交互网。前端学习圈:767
2023-06-03

Python基础知识点总结

学了一年多的Python,去年做了一段时间的爬虫项目,近来在做数据分析和机器学习的东西,抽空整理一下以前学的Python基础知识点,有借鉴与总结。具体知识点后续会分段展开深入。   1.到底什么是Python?你可以在回答中与其他技术进行对
2023-01-31

JAVA基础知识点总结

文章目录 前言一、JAVA简介二、基础语法面向对象StringIntegerObject异常IO序列化Java 泛型注解反射 前言 一、JAVA简介 Java 是一门面向对象的编程语言。 语言特点:面向对象,平台无关性,支持多
2023-08-18

总结数据库知识点

本篇内容主要讲解“总结数据库知识点”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“总结数据库知识点”吧!存储引擎InnoDBInnoDB 是 MySQL 默认的事务型存储引擎,只要在需要它不支持的
2023-06-16

编程热搜

目录