ShannonAI / glyce

Code for NeurIPS 2019 - Glyce: Glyph-vectors for Chinese Character Representations
https://arxiv.org/abs/1901.10125
Apache License 2.0
419 stars 75 forks source link

请问如何训练自己的Glyce,或者在你们开放的预训练模型上微调 #29

Open Crescentz opened 4 years ago

Crescentz commented 4 years ago

reademe 不是很清晰

Pigdrum commented 3 years ago

真的很不清晰!

Pigdrum commented 3 years ago

请问start quick里的input_idx怎么输入呢?怎么把句子embedding成向量呢?

SunnyPann commented 3 years ago

请问,自己训练Glyce成功了吗

Young1993 commented 3 years ago

模型用from PIL import ImageFont来读取字体的,然后转换embedding形式的张量, embeddings = position_embeddings + glyph_embeddings 直接和位置embed相加 再和下游的bert一起训练,训练保存词向量,完成训练后,应该可以直接就使用glece-bert层之后的进行预测推理

理解错了:(这篇论文不是一个预训练任务?没有利用Glyce生成一个embedding词表么?然后再下游任务的时候,不是查这个词表的来获取权重值的?)

maturecat commented 3 years ago

来自PIL的模型用import ImageFont来读取字体的,然后转换embedding形式的形式张量, 嵌入= position_embeddings + glyph_embeddings直接和位置embed相加 再和下游的bert一起训练,训练保存词向量,完成训练后,应该可以直接就使用glece-bert层之后的进行预测推理

理解错了:(这篇论文不是一个预训练任务?没有利用Glyce生成一个embeddding词表么?然后再下游任务的时候,不是查这个词表的来获取权重值的?)

请教你个问题,论文中提到的损失函数我看不太懂,论文中讲到使用图像分类做辅助任务,那么这个图象识别任务的损失是什么?论文终提到的预测其对应的charid 这个charid是不是表明的是某个字?论文中提到的图像x的标签是z,请问这个标签是什么?在代码中图像分类任务是在哪个文件怎么做到的将数据打上标签,损失函数是在哪个文件怎么定义的?图像分类的话,常用的中文汉字几千个,他的分类是几千分类吗?