MongoDB索引
索引通常能够极大的提高查询的效率,如果没有索引,MongoDB 在读取数据时必须扫描集合中的每个文件并选取那些符合查询条件的记录。
这种扫描全集合的查询效率是非常低的,特别在处理大量的数据时,查询可以要花费几十秒甚至几分钟,这对网站的性能是非常致命的。索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构。
索引常用操作
查看集合索引
db.collection.getIndexes()
查看集合索引大小
db.collection.totalIndexSize()
删除集合所有索引
db.collection.dropIndexes()
删除集合指定索引
db.collection.dropIndex("索引名称")
索引的类型
在 MongoDB 4.x 版本中支持以下类型的索引:
单字段索引
单键索引不会自动创建,是最普通的索引。通过给某一字段加索引,并按照指定规则进行排序。但实际上,在涉及单字段索引的排序查询中,索引键的排序规则是无关紧要,因为 MongoDB 支持在任一方向上遍历索引。
db.collection.find({}).sort(
{key_name:-1}
)
db.collection.find({}).sort(
{key_name:1}
)
当前大多数数据库都支持双向遍历索引,这和存储结构有关 (如下图)。在 B-Tree 结构的叶子节点上,存储了索引键的值及其对应文档的位置信息,而每个叶子节点间则类似于双向链表,既可以从前往后遍历,也可以从后往前遍历。
复合索引
支持为多个字段创建索引,示例如下:
db.collection.createIndex( { name: -1,birthday: 1} )
需要注意的是 MongoDB 的复合索引具备前缀索引的特征,即如果你创建了索引 { a:1, b: 1, c: 1, d: 1 },那么等价于在该集合上还存在了以下三个索引,这三个隐式索引同样可以用于优化查询和排序操作:
{ a: 1 }
{ a: 1, b: 1 }
{ a: 1, b: 1, c: 1 }
所以应该尽量避免创建冗余的索引,冗余索引会导致额外的性能开销。即如果你创建了索引 { name: -1, birthday: 1},那么再创建 {name:-1} 索引,就属于冗余创建。
对于复合索引还需要注意它在排序上的限制,例如索引 {a:1, b:-1} 支持 {a:1, b:-1} 和 {a:-1, b:1} 形式的排序查询,但不支持 {a: - 1, b:-1} 或 {a:1, b:1} 的排序查询。即字段的排序规则要么与索引键的排序规则完全相同,要么完全相反,此时才能进行双向遍历查找。
多键索引
如果索引包含类型为数组的字段,MongoDB 会自动为数组中的每个元素创建单独的索引条目,这就是多键索引。MongoDB 使用多键索引来优化查询存储在数组中的内容。创建示例如下:
db.collection.createIndex( { Hobby: 1 } )
哈希索引
为了支持基于哈希分片,MongoDB 提供了哈希索引,通过对索引值进行哈希运算然后计算出所处的分片位置。语法如下:
db.collection.createIndex( { _id: "hashed" } )
采用哈希运算得到的结果值会比较分散, 所以哈希索引不能用于范围查询,只能用于等值查询。
全文索引
MongoDB 支持全文本索引,用于对指定字段的内容进行全文检索。其创建语法如下:
db.<collection>.createIndex( { field: "text" } )
需要注意的是一个集合最多可以有一个文本索引,但一个文本索引可以包含多个字段,语法如下:
db.<collection>.createIndex(
{
field0: "text",
field1: "text"
}
)
创建文本索引是一个非常昂贵的操作,因为创建文本索引时需要对文本进行语义分析和有效拆分,还需要将拆分后的关键词存储在内存中,这对设备的运算能力和存储空间都有非常高的要求,同时也会降低 MongoDB 的性能,所以需要谨慎使用。
地理空间索引
为了支持对地理空间坐标数据的有效查询,MongoDB提供了两个特殊索引:
使用平面几何的 2d 索引,主要用于平面地图数据 (如游戏地图数据)、连续时间的数据;
使用球形几何的 2dsphere 索引,主要用于实际的球形地图数据。
这些数据通常是用于解决实际的地理查询,如附近的美食、查询范围内所有商家等功能。其创建语法如下:
db.<collection>.createIndex( {
<location field> : "2d" ,
<additional field> : <value>
} )
db.collection.createIndex( {
<location field> : "2dsphere"
} )