chilynn / sequence-labeling

307 stars 167 forks source link

关于数据预处理的问题 #18

Open JasonChan7 opened 7 years ago

JasonChan7 commented 7 years ago

您好,由于您的.in文件没用体现出您的训练数据输入格式,我想请问一下对于一个含有多个分句的长句子您是将其作为一个完整句子输入 还是根据标点符号切分成为多个小句子单独输入呢?

martianmartian commented 7 years ago

这个是不是按照tf惯例,切分成等长的序列,然后输入的呢?

qujinqiang commented 6 years ago

不是等长序列,是按照句子实际长度

yuye2133 commented 5 years ago

那请问num_step是用来做截断的吗