GreenFaith / GreenFaith.github.io

wiki.shixiz.com
1 stars 0 forks source link

ninja-search (v2ex 第三方搜索引擎) #13

Open GreenFaith opened 10 years ago

GreenFaith commented 10 years ago

「自定义排序」

elasticSearch 使用自定义函数排序的时候性能比默认排序差了一个数量级。 正在着手优化中,没有 lucene 基础文档看起来相当疑惑。

update:

经实验,通过定制索引的 mapping 字段的 store 为 "yes" 然后在脚本中以 doc["field_name"].value 引用 速度可恢复到与原来接近的水平。 原因在于,使用 _source["field_name"] 引用数据,需要解析整个 _source.

GreenFaith commented 10 years ago

「功能」

只有主题搜索的能力完全不 cool 好么
考虑加入有趣的功能,比如:

输入 「@user」 可以得到用户相关回复(别人 @user 的回复)

以社区为核心,发散出去,搜索用户博客等。(复杂度较高)

根据用户 Rank 对搜索结果排序(按发帖者的 rank 排序) 方法是:

    @ 一个人算做一次投票,得票高 Rank 值高  
    被 Rank 高的人 @, 获得的 Rank 增量大于普通的 @.  
GreenFaith commented 10 years ago

排序

标题,内容,评论对得分贡献的权重比为 2:1:0.6

综合排序算法:

(doc['created'].value-1272124800000) * log10(doc['replies'].value+1)* log10(doc.score)