Closed erichuazhou closed 9 months ago
Please provide a clear and concise description of what the question is. 这是原始的 run_pt.sh --train_file_dir ./data/pretrain \ --validation_file_dir ./data/pretrain \
这是说明把 ./data/pretrain 中所有的数据都作为训练集,同时也作为验证集吗? 如何对 ./data/pretrain 中所有的数据 按某个比例的划分为训练集和验证集?
谢谢。 @shibing624
看下validation_split_percentage的逻辑,默认1%是val
如果将 train_file_dir 和 validation_file_dir 设为相同的路径,我的log显示是不会自动进行split?train数据集和validation数据集都是一样的? 请大佬解答下。谢谢。 @shibing624
validation_file_dir不设置,删了。
Describe the Question
Please provide a clear and concise description of what the question is. 这是原始的 run_pt.sh --train_file_dir ./data/pretrain \ --validation_file_dir ./data/pretrain \
这是说明把 ./data/pretrain 中所有的数据都作为训练集,同时也作为验证集吗? 如何对 ./data/pretrain 中所有的数据 按某个比例的划分为训练集和验证集?
谢谢。 @shibing624