Closed wang802 closed 3 years ago
您好!看了您gpt2相关的代码 应该是huggingface官方代码的改版。想问下GPT2Model这一块 为什么删去了原始代码中下三角掩码的部分?是否是有其他位置关于这个的实现 还是说您这一版gpt2采用的是双向编码?谢谢
您好!看了您gpt2相关的代码 应该是huggingface官方代码的改版。想问下GPT2Model这一块 为什么删去了原始代码中下三角掩码的部分?是否是有其他位置关于这个的实现 还是说您这一版gpt2采用的是双向编码?谢谢