Open kgneng2 opened 2 years ago
dl ( 문서길이) 가 짧을수록 score는 높음 평균문서길이 가중치(b)가 낮을수록 점수차이 높아짐. K가 높아질수록 낮아짐.
boost는 상대적이며, 절대적인 값이 아님
예를들어 모든필드에 10을 줬을경우 모든 값이 같으므로 1로 정규화해버린다.
3으로 했을경우 다른 필드보다 3배정도 중요하다는 뜻으로 이해한다.
boost 등 점수계산에 영향을 끼쳐 속도가 느려질경우, 재질의 를 통해서 속도 향상을 기대할수 있다. rescore
IDF
"idf, computed as log(1 + (N - n + 0.5) / (n + 0.5)) from:"
TF
TF = log(1+ termFreq)
BM25
"tf, computed as freq / (freq + k1 * (1 - b + b * dl / avgdl)) from:"