Closed cqray1990 closed 10 months ago
哈哈哈, 我们对编码做了一定的操作,把一些<td, /td>会合并成一个, 这样能把token的数量缩小一般。。 500的结构基本可以cover 99.5%以上的seqs, 再长我们确实就会直接预测错误了。
哈哈哈, 我们对编码做了一定的操作,把一些<td, /td>会合并成一个, 这样能把token的数量缩小一般。。 500的结构基本可以cover 99.5%以上的seqs, 再长我们确实就会直接预测错误了。