Term suggester
注意
为了理解 suggestions 的形式,请先阅读suggesters。
term
建议器根据编辑距离来进行词条建议。
常见的 suggest 选项
Options | Description |
| suggest 文本,suggest 文本是必须选项,需要被设定为全局或者对每个 suggestion。 |
| 从中获取候选 suggestions 的字段(field)。 这是必需的选项,需要设置为全局或按 suggestion 设置。 |
| 分词器用来分析suggest文本,默认为 suggest 字段的分词器。 |
| 每个 suggest 文本标记(token)返回的最大更正值。 |
| 定义每个 suggest 文本术语中 suggestions 该如何排序。 两个可能的值:
|
| suggest_mode 控制什么 suggestions 被包括或控制什么 suggest 文本术语,什么 suggestions 应该被 suggested。 可以指定三个可能的值:
|
其它term suggest选项
Options | Description |
| 在文本分析后的 小写 suggest 文本术语。 |
| 可以认为是候选 suggestions 的最大编辑距离。 只能是介于 |
| 为了成为候选 suggestions 所必须匹配的最小前缀字符的数量。 默认值为 |
| suggest 文本术语必须包含的最小长度。 默认值为 |
| 设置要从每个单独的分片检索的 suggestions 的最大数量。 在减少阶段期间,仅基于 |
| 用于乘以 shards_size 以便在碎片级别上检查更多候选拼写校正的因子。 可以以性能为代价提高精度。 默认为 |
| suggestion 应该出现的文档数量的最小阈值。这可以指定为绝对数字或文档数量的相对百分比。 这可以通过仅 suggesting 高频项来提高质量。 默认值为 |
| suggest 文本标记可以存在的文档数量中的最大阈值,以便包括。 可以是表示文档频率的相对百分比数字(例如0.4)或绝对数字。 如果指定的值大于1,则不能指定小数。 默认为 0.01f。 这可以用于排除高频术语的拼写检查。 高频项通常拼写正确,这也提高了拼写检查的性能。 分片级文档频率用于此选项。 |
| 使用哪个字符串距离实现来比较类似的 suggested 术语。 可以指定五个可能的值: internal - 基于 |
Last updated