roshan-research / hazm

Persian NLP Toolkit
https://www.roshan-ai.ir/hazm/
MIT License
1.21k stars 179 forks source link

اصلاح برچسب‌های اجزای سخن #2

Open nournia opened 10 years ago

nournia commented 10 years ago

برچسب‌های پیکره بیجن‌خان متفاوت هست با برچسب‌های دادگان و ما می‌خوایم یک سری برچسب داشته باشیم. من فکر می‌کنم این مجموعه برچسب عمومی که در زبان‌های مختلف تست شده، گزینه مناسبی هست:

NOUN
VERB
ADJ
ADV
PRON
DET
ADP
NUM
CONJ
PRT
.
X

همه برچسب‌های پیکره بیجن‌خان:

ADJ
ADJ_CMPR
ADJ_INO
ADJ_ORD
ADJ_SIM
ADJ_SUP
ADV
ADV_EXM
ADV_I
ADV_NEGG
ADV_NI
ADV_TIME
AR
CON
DEFAULT
DELM
DET
IF
INT
MORP
MQUA
MS
N_PL
N_SING
NN
NP
OH
OHH
P
PP
PRO
PS
QUA
SPEC
V_AUX
V_IMP
V_PA
V_PRE
V_PRS
V_SUB

برچسب‌های درشت پیکره دادگان:

ADJ
ADR
ADV
CONJ
IDEN
N
PART
POSNUM
POSTP
PR
PREM
PRENUM
PREP
PSUS
PUNC
V
SUBR
nournia commented 10 years ago

لطفا نگاه کنید @mrs818

fatemehniknezhad commented 2 years ago

از کجا متوجه بشیم که هر برچسب نشان دهنده چه نقشی است؟ من از postagger استفاده کردم و لیست برچسب ها حدود 23 تا بود توی دیتاست من، اما بعضی هاش نمیدونم به معنای چه نقشی هستند. از کجا لیست نقش هارو پیدا کنم؟ 'n', 'ne', 'p', 'v', 'conj', 'punc', 'aj', 'pro', 'aje', 'det', 'pe', 'num', 'adv', 'postp', 'dete', 'nume', 'res', 'cl', 'adve', 'rese', 'proe', 'conje', 'int'