Liadrinz / transformers-copy-mechanism

Overwrite huggingface BART and GPT with copy mechanism
19 stars 1 forks source link

src_input_ids 和 inference的疑问 #4

Open qingyujean opened 11 months ago

qingyujean commented 11 months ago
  1. 看到在构造数据是传入的input_ids,但是gpt的forward里有用到src_input_ids,这个是怎么回事呢,什么时候用到这个呢?
  2. inference时写了2种,并行和step-by-step,没看懂2种使用时的场景和区别,能详细说明下吗?
  3. 在gpt2copy里实现的_expand_inputs_for_generation、_update_model_kwargs_for_generation没看到调用的地方,这个在哪儿使用了呢? 感谢~