Closed OliverHuang1220 closed 8 months ago
在最初的训练基座模型的时候,请问对于language的torch.nn.embedding层是以什么方式初始化的?
随机。
感谢你的快速回复,是embeding默认的正太分布初始化的吗
在最初的训练基座模型的时候,请问对于language的torch.nn.embedding层是以什么方式初始化的?