shineware / KOMORAN

Korean Morphological Analyzer by shineware
Apache License 2.0
283 stars 63 forks source link

불용어 태그 설정 방법 #129

Closed jis1218 closed 4 years ago

jis1218 commented 4 years ago

안녕하세요.

엘라스틱 서치에서 코모란 분석기를 사용할 때 불용어 태그를 설정하여 분석시 원하는 품사만 얻고자 합니다.

혹시 _settings의 filter 파라미터를 설정하는 예시가 있을까요?

p.s. 코모란 애용자로써 항상 감사드립니다.


  "settings": {
    "index":{
      "analysis":{
        "tokenizer":{
          "komoran_tokenizer":{
            "type": "komoran-tokenizer",
            "decompound_mode" : "mixed"
          }
        },
        "analyzer":{
          "nori_token_analyzer":{
            "type":"custom",
            "tokenizer":"komoran_tokenizer",
            "filter" : [
              "komoran_pos_filter"
            ]
          }
        },
        "filter": {
          "komoran_pos_filter":{
            "type":???
            "stoptags":???
          }
        }
      }
    }
  }
}
shin285 commented 4 years ago

현재 공식적으로 오픈한 상태가 아니여서 추가되어야 할 내용들이 많이 있습니다. 말씀해주신 내용 구현해서 추가하도록 하겠습니다. 그 외에도 추가되면 좋을 것 같은 내용들을 알려주시면 최대한 반영될 수 있도록 노력하겠습니다. 감사합니다 :)

jis1218 commented 4 years ago

현재 공식적으로 오픈한 상태가 아니여서 추가되어야 할 내용들이 많이 있습니다. 말씀해주신 내용 구현해서 추가하도록 하겠습니다. 그 외에도 추가되면 좋을 것 같은 내용들을 알려주시면 최대한 반영될 수 있도록 노력하겠습니다. 감사합니다 :)

네 신경써주셔서 정말 감사드립니다!