请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调

ShannonAI / glyce

Code for NeurIPS 2019 - Glyce: Glyph-vectors for Chinese Character Representations

Apache License 2.0

419 stars 75 forks source link

来自PIL的模型用import ImageFont来读取字体的，然后转换embedding形式的形式张量，嵌入= position_embeddings + glyph_embeddings直接和位置embed相加再和下游的bert一起训练，训练保存词向量，完成训练后，应该可以直接就使用glece-bert层之后的进行预测推理

理解错了：（这篇论文不是一个预训练任务？没有利用Glyce生成一个embeddding词表么？然后再下游任务的时候，不是查这个词表的来获取权重值的？）

请教你个问题，论文中提到的损失函数我看不太懂，论文中讲到使用图像分类做辅助任务，那么这个图象识别任务的损失是什么？论文终提到的预测其对应的charid 这个charid是不是表明的是某个字？论文中提到的图像x的标签是z，请问这个标签是什么？在代码中图像分类任务是在哪个文件怎么做到的将数据打上标签，损失函数是在哪个文件怎么定义的？图像分类的话，常用的中文汉字几千个，他的分类是几千分类吗？

ShannonAI / glyce

请问如何训练自己的Glyce，或者在你们开放的预训练模型上微调 #29