Elasticsearch – 来自搜索团队的经验总结

最近在公司内进行技术交流分享,了解到搜索团队做的一些事情和方向,下面总结一下。

Part1

分词器用了ik和ansj,后者据说在实际搜索效果上可能好于ik。

Part2

业务只向搜索同步ID,由搜索主动抓取业务接口获取文档所需数据,高频更新基于redis做了去重。

Part3

为了保障搜索服务稳定性,将数据通过多个队列写入了多个ES集群。为了减少备份资源的浪费,备份集群也对外服务,不过目前是按功能划分集群的,比如全文检索走主集群,搜索联想走备集群。

Part4

遇到过性能问题,主要是某些query召回的文档数量太多了,都参与排序打分会造成慢查询。解决方法是人工干预,通过配置slow query清单,对这部分query作一些基于时间的过滤,确保召回结果量级可控。

你必须付费加入我的知识星球,为有效知识付费是对作者最好的回报。

二维码见下方 或者 右侧边栏。

发表评论

电子邮件地址不会被公开。