solr查询(and,or)以及查询结果排序

参考教程 靠谱教程2

1.基本查询

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
q  查询的关键字,此参数最为重要,例如,q=id:1,默认为q=*:*,

  fl 指定返回哪些字段,用逗号或空格分隔,注意:字段区分大小写,例如,fl= id,title,sort

  start 返回结果的第几条记录开始,一般分页用,默认0开始

  rows 指定返回结果最多有多少条记录,默认值为 10,配合start实现分页

  sort 排序方式,例如id desc 表示按照 “id” 降序

  wt (writer type)指定输出格式,有 xml, json, php等

  fq (filter query)过虑查询,提供一个可选的筛选器查询。返回在q查询符合结果中同时符合的fq条件的查询结果,例如:q=id:1&fq=sort:[1 TO 5],找关键字id为1 的,并且sort是15之间的。

  df 默认的查询字段,一般默认指定。

  qt (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。

  indent 返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。

  version 查询语法的版本,建议不使用它,由服务器指定默认值。

Solr的检索运算符

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
“:”  指定字段查指定值,如返回所有值*:*

  “?” 表示单个任意字符的通配

  “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)

  “~” 表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。

  AND、|| 布尔操作符

  OR、&& 布尔操作符

  NOT、!、-(排除操作符不能单独与项使用构成查询)

  “+” 存在操作符,要求符号”+”后的项必须在文档相应的域中存在²

  ( ) 用于构成子查询

  [] 包含范围检索,如检索某时间段记录,包含头尾,date:[201507 TO 201510]

  {} 不包含范围检索,如检索某时间段记录,不包含头尾date:{201507 TO 201510}

3. 高亮

1
2
3
4
5
6
7
8
9
10
11
  h1  是否高亮,hl=true,表示采用高亮

  hl.fl 设定高亮显示的字段,用空格或逗号隔开的字段列表。要启用某个字段的highlight功能,就得保证该字段在schema中是stored。如果该参数未被给出,那么就会高亮默认字段 standard handler会用df参数,dismax字段用qf参数。你可以使用星号去方便的高亮所有字段。如果你使用了通配符,那么要考虑启用hl.requiredFieldMatch选项。

  hl.requireFieldMatch 如果置为true,除非用hl.fl指定了该字段,查询结果才会被高亮。它的默认值是false

  hl.usePhraseHighlighter 如果一个查询中含有短语(引号框起来的)那么会保证一定要完全匹配短语的才会被高亮。

  hl.highlightMultiTerm 如果使用通配符和模糊搜索,那么会确保与通配符匹配的term会高亮。默认为false,同时hl.usePhraseHighlighter要为true

  hl.fragsize 返回的最大字符数。默认是100.如果为0,那么该字段不会被fragmented且整个字段的值会被返回。

4. 分组

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
  官方wiki:http://wiki.apache.org/solr/SimpleFacetParameters#Facet_Fields_and_Facet_Queries,

  这是facet的官方wiki,里面有facet各个参数的详细说明。所以这里只说一些常用的。

  Facet是Solr的核心搜索功能,主要是导航(Guided Navigation)、参数化查询(Paramatic Search)。Facet的主要好处是在搜索的同时,可以按照Facet条件进行分组统计,给出导航信息,改善搜索体验。

  Facet主要分为:Field Facet 和 Date Facet 两大类

  1. Field Facet

    facet 参数字段必须被索引

    facet=on 或 facet=true

    facet.field 分组的字段

    facet.prefix 表示Facet字段前缀

    facet.limit Facet字段返回条数

    facet.offict 开始条数,偏移量,它与facet.limit配合使用可以达到分页的效果

    facet.mincount Facet字段最小count,默认为0

    facet.missing 如果为on或true,那么将统计那些Facet字段值为null的记录

    facet.sort 表示 Facet 字段值以哪种顺序返回 .格式为 true(count)|false(index,lex),true(count) 表示按照 count 值从大到小排列,false(index,lex) 表示按照字段值的自然顺序 (字母 , 数字的顺序 ) 排列 . 默认情况下为 true(count)



  2. Date Facet

    对日期类型的字段进行 Facet. Solr 为日期字段提供了更为方便的查询统计方式 .注意 , Date Facet的字段类型必须是 DateField( 或其子类型 ). 需要注意的是 , 使用 Date Facet 时 , 字段名 , 起始时间 , 结束时间 , 时间间隔这 4 个参数都必须提供 .

    facet.date 该参数表示需要进行 Date Facet 的字段名 , 与 facet.field 一样 , 该参数可以被设置多次 , 表示对多个字段进行 Date Facet.

    facet.date.start 起始时间 , 时间的一般格式为 ” 2015-12-31T23:59:59Z”, 另外可以使用 ”NOW”,”YEAR”,”MONTH” 等等 ,

    facet.date.end 结束时间

    facet.date.gap 时间间隔,如果 start 为 2015-1-1,end 为 2016-1-1,gap 设置为 ”+1MONTH” 表示间隔1 个月 , 那么将会把这段时间划分为 12 个间隔段 .

    facet.date.hardend 表示 gap 迭代到 end 时,还剩余的一部分时间段,是否继续去下一个间隔. 取值可以为 true|false, 默认为 false.

    例 start 为 2015-1-1,end 为 2015-12-21,gap 为 ”+1MONTH”, 如果hardend 为 false,则,最后一个时间段为 2015-12-12016-1-1; 反之,如果 hardend 为 true,则,最后一个时间段为 2015-12-12015-12-21.



  注意:Facet的字段必须被索引,无需分词,无需存储。无需分词是因为该字段的值代表了一个整体概念,无需存储是因为一般而言用户所关心的并不是该字段的具体值,而是作为对查询结果进行分组的一种手段,给出相关的分组信息,从而改善搜索体验。

以上是基础gui界面操作

解决solr搜索多词匹配度和排序方案

1.结果排序的分词的权重问题 参考教程

1
2
3
4
5
6
7
8
9
10
排序结果:按照solr的打分公式。默认匹配相关度最高的文档放在第一位。。简单的说。就是文档中,同时含有 中国 、联想 、 笔记本 分值最高。这种需求一般可以满足部分的企业级搜索。

但是:如果需要自定义排序的话,问题就逐渐暴露了。

通过requestHandler queryParser edismax 中的 df qf,通过字段的权重配置和 各个维度的积分模型之后,得出的排序。就不一定按照同时 含有 中国 、联想 、 笔记本优先级排序了。。有些只包含 中国  这个词的优先级很高 也有可能。这种结果排序 明显不能理解和符合用户的意思。
---------------------
作者:千丈之松
来源:CSDN
原文:https://blog.csdn.net/hu948162999/article/details/47727159?utm_source=copy
版权声明:本文为博主原创文章,转载请附上博文链接!

2.solr 根据评分机制排序 score