issues
search
yutanakamura-tky
/
medical_ai_survey_acl2019
Survey of Medical AI papers
1
stars
0
forks
source link
W19-5008: MoNERo: a Biomedical Gold Standard Corpus for the Romanian Language
#58
Open
iBotamon
opened
5 years ago
iBotamon
commented
5 years ago
https://aclweb.org/anthology/papers/W/W19/W19-5008/
iBotamon
commented
5 years ago
どんなもの?
ルーマニア語で医療言語処理を行うためのアノテーション付きコーパスを公開したという論文
MoNERo = morphologically and named entity annotated Romanian medical corpus
アノテーションの詳細なガイドラインについても説明している
コーパスは品詞タグ付けと固有表現抽出に対応
紹介されている,他言語の既存の固有表現アノテーション付きコーパスは以下のとおり:
英語
CLEF corpus, i2b2 corpus, NCBI corpus, CHEMDNER corpus
フランス語
Quaero corpus
スペイン語
IxaMedGS corpus
DrugSemantics corpus
先行研究と比べてどこがすごい?
ルーマニア語の既存の医療言語コーパスにはCoRoLa, ROMBACなどがあるが, 医療ドメインに適した固有表現タグ付けを行なっている点が異なる
技術や手法のキモはどこ?
主なソースは成書とし, 論文やブログ記事も使用
循環器, 糖尿病, 内分泌に関係するものを中心に選んだ
糖尿病診療への応用を見据えているため
固有表現タグ付けはUMLS (Unified Medical Language System) semantic groupsに則って行った
タグは4種類
ANAT=Anatomy
CHEM=Chemicals and drugs
DISO=Disorders
PROC=Procedures
どうやって有効だと検証した?
実験は行なっていない
議論はある?
次に読むべき論文は?
https://aclweb.org/anthology/papers/W/W19/W19-5008/