elasticsearch的Term查询

基于Term的查询

Term是表达语意的最小单位。搜索和利用统计语言模型进行自然语言处理都需要Term

特点

  • Term Level Query: term Query / Range Query / Exists Query / Prefix Query / Wildcard Query
  • 在ES中,Term查询,对输入不做分词,会将输入作为一个整体,在倒排索引中查找准确的词项,并且使用相关度算分公司为每个包含该词项的文档进行相关度算分。
  • 可以用个Constant Score 将查询转换成一个Filtering、避免算分,并利用缓存,提高性能。
可以搜索到结果:
POST /products/_search
{
  "query": {
    "term": {
      "desc": {
        "value":"iphone"
      }
    }
  }
}

搜索不到结果:
POST /products/_search
{
  "query": {
    "term": {
      "desc": {
       "value": "iPhone"
   
      }
    }
  }
}

可以搜索结果:
POST /products/_search
{
  "query": {
    "term": {
      "desc.keyword": {
        "value": "iPhone"
        //"value":"iphone"
      }
    }
  }
}

搜索不到结果:
POST /products/_search
{
  "query": {
    "term": {
      "desc.keyword": {
        "value":"iphone"
      }
    }
  }
}

Term查询不会分词,会增加keyword字段,利用这个字段可以进行查询结果的。

基于全文的查询

  • Match Query / Match Phrase Query / Query String Query

特点

  • 索引和搜索都会进行分词,查询字符串先传递到一个合适的分词器,然后生成一个供查询的词项列表
  • 查询的时候,先对输入的查询进行分词,然后每个词项逐个进行底层的查询,最终将结果进行合并,并未每个文档生成一个算分。
PUT groups
{
  "mappings": {
    "properties": {
      "names":{
        "type": "text",
        "position_increment_gap": 0
      }
    }
  }
}

POST groups/_doc
{
  "names": [ "John Water", "Water Smith"]
}


POST groups/_search
{
  "query": {
    "match_phrase": {
      "names": {
        "query": "Water Water",
        "slop": 100
      }
    }
  }
}


POST groups/_search
{
  "query": {
    "match_phrase": {
      "names": "Water Smith"
    }
  }
}

文章作者: 凌云
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 凌云 !
  目录