MongoDB索引管理（1）——[九]

eksliang

浏览: 592330 次
性别:
来自: 广州

最近访客更多访客>>

hanjiangit

gtsle

sshcainiao

yinzisheng

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

MongoDB

MongoDB MongoDB管理索引

转载请出自出处：http://eksliang.iteye.com/blog/2178427

一、概述

数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。

不使用索引的查询称为全表扫描（这个术语来源于关系型数据库），也就是说，服务器必须查找完一整本书才能找到查询结果。这个过程跟我们在一本没有索引（目录）的书中查找信息很像：从第一页开始一直读完整本书。通常来说，应该尽量避免使用全表扫描，因为对于大集合来说，全表扫描的效率非常低。

Mongodb的索引几乎与关系型数据库的索引一模一样，所以适用于关系型数据库索引优化技巧，在这里就不多说了。

二、创建索引

创建索引使用db.collectionName.ensureIndex(...)方法进行创建；

参考实例一：创建普通索引

> db.users.ensureIndex({"name":1})

这样就在users这个集合上面的name字段上面创建了一个name_1的索引，{"name":1}说明建立的索引是升序的，如果{"name":-1}说明创建的索引是降序的。

参考实例二：创建普通复合索引

db.users.ensureIndex({"name":1,"age":1})

这样就在users这个集合上面的name和age字段上面创建了一个name_1_age_1的索引.

参考实例三：创建唯一索引

唯一索引可以确保集合里面的每一个文档指定的键都有唯一值。例如，如果想保证不同文档的name键拥有不同的值，创建一个唯一索引就可以了：

> db.dept.ensureIndex({"name":1},{"unique":true})

创建完唯一索引以后，如果想向dept集合中添加如下文档：

> db.dept.insert({ "_id" : 1, "name" : "ickes" })
> db.dept.insert({ "_id" : 2, "name" : "ickes" })

会发现只有第一个文档添加进去了，添加第二个时就会抛出异常，所以使用唯一索引来应对偶尔可能出现键重复的问题，而不是在运行时对重复键进行过滤。"_id"就是这中类型的索引，这个索引会在创建集合时自动创建。

参考实例三：创建复合唯一索引

创建复合唯一索引时，单个键的值可以相同，但是所有键的组合的值必须是唯一的。

> db.users.ensureIndex({"name":1,"age":1},{"unique":true})

参考实例四：创建唯一索引时去除重复

在已有的集合上面创建唯一索引时，可能失败，因为集合中可能已经存在重复值了，如下所示：

> db.dept.find() 
{ "_id" : 1, "name" : "ickes" }
{ "_id" : 2, "name" : "ickes" }
{ "_id" : 3, "name" : "ickes1" }
{ "_id" : 4, "name" : "eks" }
{ "_id" : 5, "name" : "eks" }
--从上面的集合中看出name已经有大量重复值，创建唯一索引时抛出异常
> db.dept.ensureIndex({"name":1},{"unique":true})
{
        "createdCollectionAutomatically" : false,
        "numIndexesBefore" : 1,
        "ok" : 0,
        "errmsg" : "E11000 duplicate key error index: test.dept.$name_1  dup key
: { : \"eks\" }",
        "code" : 11000
}

通常需要对已有的数据进行处理（可以使用聚合框架，后面会说），找出重复的数据，想办法处理。

在极少数情况下，可能希望直接删除重复的值。创建索引时使用"dropDups"选项，如果遇到重复的值，第一个会被保留，之后的重复文档都会被删除。

 >  db.dept.ensureIndex({"name":1},{"unique":true,"dropDups":true})
{
        "createdCollectionAutomatically" : false,
        "numIndexesBefore" : 1,
        "numIndexesAfter" : 2,
        "ok" : 1
}

"dropDups"会强制性的建立唯一索引，但是这个方式太粗暴了：你无法控制那些文档需要被保留，那些文档需要被删除（从上面打印的信息可以看出，如果文档被删除了，MongoDB也不会给出提示信息）。对于比较重要的数据，千万不要使用"dropDups".

参考实例四：创建稀疏索引

唯一索引会把null值看做值，所以无法将缺少键的多个文档插入到建立的唯一索引的集合中。然而，在某些情况下，你可能希望唯一索引只针对包含相应键的文档生效。如果有一个可能存在也有可能不存在的字段，当字段存在时是唯一索引，不存时不做处理，这时就可以将unique和sparse选项组合在一起使用。

使用sparse选项就可以创建稀疏索引。例如集合的结构如下：

> db.sparse.find()
{ "_id" : 1, "x" : 1 }
{ "_id" : 2, "x" : 2 }
{ "_id" : 3, "x" : null }
{ "_id" : 4 }

创建稀疏索引

> db.sparse.ensureIndex({"x":1},{"unique":true,"sparse":true})

稀疏索引不必是唯一的。只要去掉unique选项，就可以创建一个非唯一的稀疏索引

MongoDB的稀疏索引与关系型数据库中的稀疏索引是完全不同的概念。基本上来说，MongoDB中的稀疏索引只是不需要将每个文档都作为索引条目。那么问题来了，根据是否使用稀疏索引，同一个查询的返回结果可能不同。

例如上面文档，当在x上面执行查询时，他会返回相应匹配的文档：

> db.sparse.find({"x":{"$ne":1}}).hint({}) --hint({})强制不使用索引
{ "_id" : 2, "x" : 2 }
{ "_id" : 3, "x" : null }
{ "_id" : 4 }

如果在x字段上面使用索引，那么{ "_id" : 4 }的文档将不会返回，因为他不在索引中，例如：

> db.sparse.find({"x":{"$ne":1}}).hint({"x":1})
{ "_id" : 3, "x" : null }
{ "_id" : 2, "x" : 2 }

二、查看索引

所有数据库索引信息都存储在system.indexes集合中。这是一个保留集合，不能在其中插入或者删除文档。只能通过ensureIndex({...})或者dropIndexes对他进行操作：

参考实例一：查看所有数据库建立的索引详情

> db.system.indexes.find()
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "test.users" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "test.dept" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "test.food" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "test.test" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "test.emp" }
{ "v" : 1, "key" : { "_id" : 1 }, "name" : "_id_", "ns" : "test.blog" }
 ................省略!

参考实例二：查看特定集合的索引信息

> db.users.getIndexes()
[
        {
                "v" : 1,
                "key" : {
                        "_id" : 1
                },
                "name" : "_id_",
                "ns" : "test.users"
        },
        {
                "v" : 1,
                "key" : {
                        "name" : 1,
                        "age" : 1
                },
                "name" : "name_1_age_1",
                "ns" : "test.users"
        }
]
>

这里最重要的字段是key和name，key说明了你创建索引时字段跟排序，name就是索引的名称，默认为key_dir_key_dir....的格式，"v"字段只在内部使用，用于标识索引的版本。如果你的索引不包含“v”:1这样的字段，说明你的索引是一种效率比较低的旧方式存储的。将MongoDB升级到至少2.0的版本，删除并重建这些索引，就可以把所有的存储方式升级到新的格式了。

三、标识索引

集合中的每一个索引都有一个名称，用于唯一标识索引，也可以用于服务器端来删除索引。索引默认的命名方式是key1_dir1_key2_dir2....keyn_dirn,其中key就是索引的键，dir是索引的排序方向（1或者-1），如果索引中包含的键比较多，这种默认的命名方式就显得比较笨重，可以再创建索引时指定索引的名称。

参考实例：

> db.users.ensureIndex({"name":1,"age":1},{"name":"name_age1"})

温馨提示：MongoDB索引名称的长度有限，所以新建复杂索引时可能需要自定义索引名称.

四、删除索引

参考实例一：删除集合里面的所有索引

 > db.users.dropIndexes()

参考实例二：根据索引的key或者name删除集合里面的指定索引

> db.users.dropIndex("name_1_age_1")--根据索引的name删除
> db.users.dropIndex({"name":1,"age":1})--根据索引的key删除

分享到：

MongoDB索引调优（2）——[十] | MongoDB查询(4)——游标和分页[八]

2015-01-22 14:16
浏览 7192
评论(0)
分类:研发管理
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

毕业设计：基于SSM的mysql-羽毛球交流平台系统（源码 + 数据库 + 说明文档）: 毕业设计：基于SSM的mysql_羽毛球交流平台系统（源码 + 数据库 + 说明文档） 2 关键技术介绍 6 2.1 JSP技术概述 6 2.2 MYSQL简介 6 2.3 B/S结构 7 2.4 JAVA语言 8 2.5 MyEclipse简介 9 2.6 性能分析 9 2.7 SSM概述 10 3 需求分析与设计 11 3.1 系统需求分析 11 3.2 运行可行性 11 3.3 系统可行性分析 11 3.3.1 技术可行性 11 3.3.2 经济可行性 12 3.3.3 操作可行性 12 3.4 系统功能分析 12 3.5 系统功能结构图 13 3.6 系统流程分析 14 4 数据库设计 17 4.1数据库逻辑结构设计 17 4.2数据库物理结构设计 20 5 系统的详细设计与实现 25 5.1首页页面 25 5.2站内新闻页面 25 5.3场地列表页面 26 5.4场地详情页面 26 5.5在线留言页面 27 5.6修改密码页面 27 5.7注册用户管理信息页面 28 5.8场地信息管理页面 28 5.9场地预约管理页面 29 5.10评论信息管理页面 29 5.11添加友情链

node-v10.15.1-win-x64.zip: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

VLT 变频器工程指南 danfoss: VLT 变频器工程指南 Guía de funcionamiento Safe Torque off Convertidores de frecuencia VLT

基于Java的C语言试题生成与考试系统的设计与实现（源代码+论文）: 基于Java的C语言试题生成与考试系统的设计与实现是一个毕业设计题目，旨在通过使用Java编程语言设计和开发一个功能完善的C语言试题生成与考试系统。该毕业设计题目的背景和意义在于，随着计算机科学的不断发展，C语言作为一门基础编程语言，被广泛应用于软件开发、系统编程等领域。为了更好地评估学生对C语言的掌握程度，传统的纸质试卷已经无法满足需求，因此，开发一个基于Java的C语言试题生成与考试系统具有重要的实际意义。该毕业设计题目的主要研究内容包括以下几个方面：首先，需要进行系统需求分析，明确系统的功能需求和技术要求。然后，需要进行系统设计，包括数据库设计、模块划分、算法设计等。接下来，需要使用Java编程语言进行系统开发，包括前端界面开发、后台逻辑实现、数据库操作等。最后，需要进行系统测试和优化，确保系统的稳定性和可靠性。通过完成该毕业设计题目，学生可以深入学习和掌握Java编程语言，提高软件开发能力。同时，学生还可以学习和了解C语言的相关知识，以及试题生成和考试系统的设计与实现方法。这对于学生未来的职业发展具有积极的推动作用。

毕业设计：基于SSM的mysql-智能图书馆导航系统（源码 + 数据库 + 说明文档）: 毕业设计：基于SSM的mysql_智能图书馆导航系统（源码 + 数据库 + 说明文档） 2 系统总体设计 1 2.1 需求调研 1 2.2系统功能性需求 2 2.3可行性分析 3 2.2.1经济可行性 3 2.2.2技术可行性 3 2.2.3操作可行性 4 2.4功能性需求分析 4 2.5本章小结 5 第3章系统设计 6 3.1设计的思路 6 3.2系统结构设计 6 3系统功能结构 6 3.3数据库设计 7 3.3.1数据库设计概述 7 3.3.2概念设计 8 3.3.3表设计 9 3.4业务功能设计与实现 11 3.4.1查询功能的设计与实现 11 3.4.2借阅功能的设计与实现 12 第四章系统实现 14 4.1 系统登录页面实现 14 4.2管理员操作界面实现 14 4.3 图书管理实现 15 4.4读者表管理实现 17 4.5 借还管理实现 17 4.6图书借阅实现 18 4.7我的借还信息实现 18 第五章系统测试 20 5.1系统测试环境 20 5.2系统单元测试 20 5.3集成测试 20 5.4测试用例 21 5.5 性能测试 21 5.6 测试结果分析 22

毕业设计：基于SSM的mysql-学习交流平台（源码 + 数据库 + 说明文档）: 毕业设计：基于SSM的mysql_学习交流平台（源码 + 数据库 + 说明文档）第二章需求分析 5 2.1需求调研 5 2.2可行性分析 6 2.2.1技术的可行性 6 2.2.2经济的可行性 6 2.2.3操作可行性 6 2.2.4法律的可行性 7 2.3系统用户用例图 7 2.3.1管理员用例图 7 2.4功能模块需求分析 7 2.5设计的基本思想 9 2.6性能需求 9 2.6.1系统的安全性 9 2.6.2数据的完整性 9 2.7界面需求 10 2.7非功能性需求分析 11 2.7.1端到端响应时间 11 2.7.2易用性需求 11 2.7.3 可扩展性 11 第三章系统分析与设计 12 3.1数据库的分析与设计 12 3.1.1数据库的概念结构设计 13 3.1.2数据库的逻辑结构设计 14 第四章系统功能实现 17 4.1系统登陆页面实现 17 4.2总体功能模块 18 4.2.1注册用户信息管理 19 4.2.2学习资讯管理信息管理 20 4.2.3文章发表管理 21 4.2.4公告信息管理 22 4.2.5留言信息管理 22 4.2.6修改密码 23 4.2.

基于JAVA的RSA文件加密软件的设计与实现(源代码+论文).rar: 本资料包名为“基于JAVA的RSA文件加密软件的设计与实现”，是一个针对计算机专业学习者提供的实用资源。它包含了完整的Java源代码以及一篇详细的论文，旨在帮助用户深入理解并实践RSA加密算法在文件加密领域的应用。该源码是基于Java语言开发的，利用了Java平台的安全和网络特性，实现了一个简单而强大的RSA文件加密工具。通过这个工具，用户可以对任意文本或数据文件进行加密和解密操作，确保信息传输的安全性。代码结构清晰，注释齐全，便于学习和修改。配套的论文则详细介绍了整个项目的设计理念、开发过程、关键技术点以及可能的改进方向。它从理论到实践，逐步引导读者了解RSA加密原理，并通过实例演示如何在Java环境中实现这一算法。无论是对于正在学习密码学、网络安全或是Java编程的学生，还是对于需要实现文件加密功能的开发者来说，这份资料包都是一份宝贵的学习资源。它不仅提供了现成的解决方案，更开辟了一条探索信息安全和Java编程深层次结合的道路。重新回答||

毕业设计：基于SSM的mysql-学生网上请假系统（源码 + 数据库 + 说明文档）: 毕业设计：基于SSM的mysql_学生网上请假系统（源码 + 数据库 + 说明文档）第2章主要技术和工具介绍 5 2.1 SSM 框架 5 2.1.1. Spring 框架 5 2.1.2 SpringMVC 6 2.1.3. MyBatis 的选用 6 2.2 mysql数据库 6 2.3eclipse与Tomcat简介 6 第3章系统分析 4 3.1可行性分析 4 3.1.1经济可行性 4 3.1.2技术可行性 4 3.1.3操作可行性 4 3.2需求分析 4 3.3业务流程分析 5 3.4数据流程分析 5 第4章系统设计 8 4.1系统结构设计 8 4.2功能模块设计 8 4.3数据库设计 9 4.3.1数据库设计概述 9 4.3.1概念设计 9 4.3.2表设计 11 第5章系统实现 15 5.1基本论坛 15 5.2主页面的实现 15 5.3登录模块的实现 16 5.4班级信息管理模块的实现 17 5.6基础信息模块的实现 18 5.6用户权限管理模块的实现 19 5.7学生请假管理模块的实现 22 第6章系统测试 23 6.1测试目的 23 6.2测试概述

MFC，C++-简单学生成绩管理系统.zip: 学生成绩管理系统c

node-v8.5.0-win-x64.zip: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

基于matlab开发的AUV惯性导航系统matlab仿真程序，包括轨迹生成、gps和sins组合、gps和dvl组合.rar: 基于matlab开发的AUV惯性导航系统matlab仿真程序，包括轨迹生成、gps和sins组合、gps和dvl组合.rar

M24LC04B EEPROM的Verilog行为模型: M24LC04B EEPROM的Verilog行为模型

node-v12.5.0-x86.msi: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

2023商业银行数据资产体系白皮书，主要介绍了“三位一体”数据资产体系的构成与工作机制，以及商业银行数据资产体系建设实践: 2023商业银行数据资产体系白皮书目录第 1 章数据资产化与数据要素市场化相辅相成，相互促进第 2 章数据资产化是企业数据治理向上演进的必经之路第 3 章数据资产体系发展概述第 4 章 “三位一体”数据资产体系的构思 4.1“三位一体”数据资产体系的构成与工作机制 数据资产管理 数据资产运营 数据资产评价 数据资产体系工作机制 4.2“三位一体”数据资产体系的相互作用关系 4.3“三位一体”数据资产体系的构建 4.4“三位一体”数据资产体系的优势第 5 章商业银行数据资产体系建设实践 5.1商业银行开展数据资产体系建设的背景和目标 5.2商业银行数据资产体系建设的工作步骤 5.3上海银行数据资产体系建设实践的主要成果第 6 章数据要素流通市场赋能企业数据资产化 6.1全国多层次数据要素市场的建设 6.2上海数据交易所赋能企业数据资产化 6.3数据要素流通交易市场赋能企业数据资产化的展望第 7 章未来演进与展望

基于matlab实现wsn路由，用matlab仿真，具有选簇的功能.rar: 基于matlab实现wsn路由，用matlab仿真，具有选簇的功能.rar

什么是学生成绩管理系统c++以及学习学生成绩管理系统的意义: 学生成绩管理系统c++

Dubins曲线算法讲解和在运动规划中的使用.pdf: Dubins曲线算法讲解和在运动规划中的使用.pdf

基于TOGAF的4A企业架构规划方法论.pptx: 基于TOGAF的4A企业架构规划方法论.pptx

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论