Closed leeyu891222 closed 9 months ago
我注意到loader.py程式碼中對於中文以外的數據集,有對超過150 points的資料進行過濾。 但ScriptDataset.self.indexes並沒有在getitem()中被使用到,導致於英日資料集上只會採用前len(self.indexes)筆資料。
self.indexes表示数据集的长度,并不是用在__getitem__()中,而是用在__len__()中
__getitem__()
__len__()
我注意到loader.py程式碼中對於中文以外的數據集,有對超過150 points的資料進行過濾。 但ScriptDataset.self.indexes並沒有在getitem()中被使用到,導致於英日資料集上只會採用前len(self.indexes)筆資料。