issues
search
tomishima2904
/
explore_conceptnet
0
stars
0
forks
source link
抽出文に上限を設け、重複を排除
#18
Closed
tomishima2904
closed
1 year ago
tomishima2904
commented
1 year ago
抽出した文の数が200,000を超えるものはサイズが膨大にも関わらず、学習の妨げになるような語の組(例.
の
と
が
)ばかりだったので、排除した
(
犬
,
猫
) と (
猫
,
犬
) のような組み合わせが同じものは、文の抽出において差別化する必要がないため、重複を排除した
の
とが
)ばかりだったので、排除した犬
,猫
) と (猫
,犬
) のような組み合わせが同じものは、文の抽出において差別化する必要がないため、重複を排除した