Wanghui-Huang / CQU_bigdata

重庆大学计算机学院“大数据课程群”实验及PPT
143 stars 40 forks source link

实验四 报错ZeroDivisionError: division by zero #14

Closed lympassion closed 2 years ago

lympassion commented 4 years ago

查看test_after.csv 发现,这个文件是空的, 修改处理test.csv的过程如下:

  1. 在处理test.csv文件是也要像train.csv一样执行“sed -i '1d' ./src/test.csv ”命令,去除csv第一行;
  2. 将处理脚本的判断条件if($1 && $2 && $3 && $4 && !$5)修改为if($1 && $2 && $3 && $4 && ($5 != -1))。 再次运行,结果输出正确 重新上传到hdfs下,问题解决。