MongoDB正則表達式
正則表達式常用來在所有語言中搜索字符串的任何模式或文字。MongoDB還提供了正則表達式功能的字符串模式使用正則表達式$regex操作符。MongoDB使用PCRE(Perl兼容正則表達式)為正則表達式語言。
不同於文本搜索,我們不需要做任何配置或命令就能直接使用正則表達式。
考慮下包含文字後其標簽的帖子集合,文檔結構如以下:
{ "post_text": "enjoy the mongodb articles on yiibai", "tags": [ "mongodb", "yiibai" ] }
使用正則表達式表達
下麵的正則表達式查詢搜索所有包含字符串 gitbook.net 的帖子:
>db.posts.find({post_text:{$regex:"gitbook.net"}})
同樣的查詢也可以寫為:
>db.posts.find({post_text:/gitbook.net/})
使用正則表達式不區分大小寫
為了使搜索不區分大小寫,我們使用$options 帶有值參數 $i。下麵的命令會搜索字符串:gitbook.net,不論大小寫:
>db.posts.find({post_text:{$regex:"yiibai",$options:"$i"}})
該查詢重新調整的結果是:其中在大小下包含詞語 yiibai 文檔,如以下:
{ "_id" : ObjectId("53493d37d852429c10000004"), "post_text" : "hey! this is my post on Yiibai", "tags" : [ "yiibai" ] }
使用正則表達式的數組元素:
我們還可以使用數組字段正則表達式概念。 這時候我們實現標簽的功能顯得尤為重要。 所以,如果想要搜索帶有標簽以詞組tutorial開始所有的帖子(無論是tutorial或tutorials或tutorialjava或tutorialphp),都可以使用下麵的代碼:
>db.posts.find({tags:{$regex:"tutorial"}})
優化正則表達式查詢:
- 如果文檔字段已被索引,查詢將使用使用索引值的匹配正則表達式。 這使得搜索非常快,正則表達式相對於掃描整個集合。
- 如果正則表達式是一個前綴表達式,所有的匹配是以某一串字符開始。例如,如果正則表達式 ^tut, 查詢有隻搜索那些開始串 tut.