liangzh63 / DORM-CSC

The repository for ACL 2023 paper: Disentangled Phonetic Representation for Chinese Spelling Correction
7 stars 0 forks source link

你好,请问下数据处理文件data_process.py加载的预训练语言模型chinese_roberta_csc_pinyin是预训练了ReaLiSe中的拼音bert得到的吗? #1

Closed YaoYao5 closed 7 months ago

liangzh63 commented 12 months ago

你好。不是的。

--------------原始邮件-------------- 发件人:"YaoYao5 @.>; 发送时间:2023年11月3日(星期五) 下午4:48 收件人:"liangzh63/DORM-CSC" @.>; 抄送:"Subscribed @.***>; 主题:[liangzh63/DORM-CSC] 你好,请问下数据处理文件data_process.py加载的预训练语言模型chinese_roberta_csc_pinyin是预训练了ReaLiSe中的拼音bert得到的吗? (Issue #1)

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

YaoYao5 commented 12 months ago

谢谢作者,那请问下可以公开下处理好之后的数据吗?如果不方便公开模型chinese_roberta_csc_pinyin的话。

liangzh63 commented 12 months ago

可以尝试按照论文方法处理就好,只需在词表加上对应的拼音即可

--------------原始邮件-------------- 发件人:"YaoYao5 @.>; 发送时间:2023年11月3日(星期五) 下午5:03 收件人:"liangzh63/DORM-CSC" @.>; 抄送:"梁子宏 @.>;"Comment @.>; 主题:Re: [liangzh63/DORM-CSC] 你好,请问下数据处理文件data_process.py加载的预训练语言模型chinese_roberta_csc_pinyin是预训练了ReaLiSe中的拼音bert得到的吗? (Issue #1)

谢谢作者,那请问下可以公开下处理好之后的数据吗?如果不方便公开模型chinese_roberta_csc_pinyin的话。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

YaoYao5 commented 12 months ago

好的,谢谢作者