`
gcgmh
  • 浏览: 349418 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

solr的一些查询语法

    博客分类:
  • Solr
阅读更多
Solr 及 lucene 的 query 使用方法初級解說



1. 首先假設我的資料裡fields有:name, subbranch, tel, address 預設的搜尋是name這個欄位, 如果要搜尋的資料剛好就是 name 這個欄位,就不需要指定搜尋欄位名稱.
2. 查詢規則:
如欲查詢特定欄位(非預設欄位),請在查詢詞前加上該欄位名稱加 “:” (不包含”號) 符號,
例如: address:台北台北市中正區重慶南路一段xxx號 tel:23xxxxx1

1. q代表query input
2. version代表solr版本(建議不要變動此變數)
3. start代表顯示結果從哪一筆結果資料開始,預設為0代表第一筆, rows是說要顯示幾筆資料,預設為10筆
(因為有時查詢結果可能有幾百筆,但不需要顯示所有結果,所以預設是從第一筆開始到第十筆)
所以若要顯示第10到30筆就改為:
http: //localhost:8080/solr/select/?indent=on&version=2.2&q=address:台北 台北市中正區重慶南路一段xxx號+tel:23xxxxx1&version=2.2&start=10&rows= 20&indent=on
4. indent代表輸出的xml要不要縮行.預設為開啟 on

5. 另外,要限定輸出結果的內容可用 “fl=” 加上你要的欄位名稱,如以下這個範例:
http: //localhost:8080/solr/select/?indent=on&version=2.2&q=text:總統府+ OR+text:郵局&start=0&rows=10&fl=name,subbranch,tel
在fl=之後加上了name,subbranch,tel
所以結果會如下:
<result name=”response” numFound=”1340″ start=”0″>
<doc>
<str name=”name”>總統府郵局</str>
<str name=”subbranch”>台北15支</str>
<str name=”tel”>23xxxxxx9</str>
</doc>

<doc>
<str name=”name”>總統府</str>
<str name=”subbranch”/>
<str name=”tel”>23xxxxxx1</str>
</doc>
</result>

3. 查詢 name 或 subbranch:直接輸入查詢詞, 如: 7-eleven 忠孝店
送出的內容即為:
name:7-eleven AND subbrahch:忠孝店

4. 若要搜尋聯集結果,請在詞與詞間空格或加上大寫 “OR” (不包含”號).
例如: text:總統府 OR text:郵局
text:總統府 OR 郵局

總統府 郵局

name:總統府 OR tel:23xxxxxx3

name:總統府 tel:23xxxxxx3

5. 若要搜尋交集結果,請在詞與詞間加上大寫 “AND” 或 “+” (不包含”號).
例如: text:總統府 AND text:郵局

+text:總統府 +text:郵局

name:總統府 AND tel:23xxxxxx3

name: ( +總統府 +郵局)

6. 排除查詢
在要排除的詞前加上 “-” (不包含”號) 號
例如: 總統府 -郵局
搜尋結果不會有包含郵局的詞的結果在內

7. Group 搜尋
使用 “()” 來包含一個group
如希望搜尋在店名欄位內同時有 “台北”(不包含”號) 及 “火車站”(不包含”號)

8. 增加權重: 如要搜尋 “中華 加油站”(不包含”號) 但因為回傳太多筆資料內有 “中華”(不包含”號) 或 “加油站”(不包含”號) 的結果,
所以想要把有包含 “加油站”(不包含”號)的資料往前排,可使用 “^”(不包含”號)符號在後面加上愈增加的權重數,
像是 “2″,則可以這樣做:

中華 加油站^2

會同時搜尋含有中華或加油站的結果,並把加油站這個詞加權所以搜尋時會先判斷加油站這一個詞在
搜尋結果中的比重,甚至假設一筆資料內加油站出現過兩次以上的就更加會有優先權.

查詢時在查詢詞後加上 “^” (不包含”號) 再加上權重分數
例如: 總統府 AND “郵局”^2

總統府^2 OR 郵局

9. Wildcard 搜尋使用 “*” 符號; 如果輸入 “中國*銀” (不包含”號), 結果會有中國信託商業銀行, 中國輸出入銀行圖書閱覽室, 中國商銀證券
中國及銀之間可夾任何長短字詞.

10. 當然還有一些更深入的用法,這裡只是初級的解說,若有興趣可以看看 lucene 或 solr的 document.

转自一台湾网友的blog,现已打不开,这是google的网页快照上的内容。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics