Data doesn't get serialized from HDFS

MarcusParadies commented 10 years ago

I have cloned and compiled the latest version of the data generator. (based on commit 3fbdb0e6ea8be82d20a6ff5be521a7e8d28eafd4)

The jobs complete successfully, but no output is serialized to the specified directory.

Here is my params.ini file:

scaleFactor:1 serializer:csv compressed:false updateStreams:false outputDir:/home/myuser/ldbc numThreads:6

I can see that the jobs produced some files on HDFS containing useful data, but the last step that serializes the block files into the final files does not work.

Any idea how to solve this?

Thanks, Marcus

ArnauPrat commented 10 years ago

Hi @MarcusParadies, Which execution mode are you using? Standalone or Pseudo-distributed mode?

MarcusParadies commented 10 years ago

I'm using the pseudo-distributed mode.

ArnauPrat commented 10 years ago

have you tried navigating through the directory structure of HDFS? What files are actually created? Which version of hadoop are you using?

MarcusParadies commented 10 years ago

I'm using Hadoop 1.2.1

The HDFS is located at /tmp/hdfs/data and contains a couple of subfolders.

The 'current' subfolder contains a couple of generated files containing the CSV headers(?) and in subdirXX are block files containing the actual data.

So I'm assuming that the files have been generated successfully and written back to HDFS. But the serialization into the final csv files does not seem to work. (also doesn't work for other output formats such as ttl btw.)

MarcusParadies commented 10 years ago

According to https://github.com/ldbc/ldbc_snb_datagen/wiki/Data-Output there should be a social_network being generated on HDFS(?). This one does not exist anywhere on my system.

As a side note: The generation of the substitution parameters did produce the expected text files.

ArnauPrat commented 10 years ago

can you paste the output of DATAGEN please?

MarcusParadies commented 10 years ago

marcus@lu285378:~/git/ldbc_snb_datagen$ ./run.sh [INFO] Scanning for projects... [INFO] ------------------------------------------------------------------------ [INFO] Building Unnamed - ldbc.socialnet.dbgen:ldbc_snb_datagen:jar:0.1 [INFO] task-segment: [clean] [INFO] ------------------------------------------------------------------------ [INFO] [clean:clean {execution: default-clean}] [INFO] Deleting file set: /home/marcus/git/ldbc_snb_datagen/target (included: [**], excluded: []) [INFO] ------------------------------------------------------------------------ [INFO] BUILD SUCCESSFUL [INFO] ------------------------------------------------------------------------ [INFO] Total time: 1 second [INFO] Finished at: Tue Oct 28 11:39:21 CET 2014 [INFO] Final Memory: 13M/724M [INFO] ------------------------------------------------------------------------ [INFO] Scanning for projects... [INFO] ------------------------------------------------------------------------ [INFO] Building Unnamed - ldbc.socialnet.dbgen:ldbc_snb_datagen:jar:0.1 [INFO] task-segment: assembly:assembly [INFO] ------------------------------------------------------------------------ [INFO] Preparing assembly:assembly [INFO] ------------------------------------------------------------------------ [INFO] Building Unnamed - ldbc.socialnet.dbgen:ldbc_snb_datagen:jar:0.1 [INFO] ------------------------------------------------------------------------ [INFO] [resources:resources {execution: default-resources}] [WARNING] Using platform encoding (UTF-8 actually) to copy filtered resources, i.e. build is platform dependent! [INFO] Copying 255 resources [INFO] [compiler:compile {execution: default-compile}] [INFO] Changes detected - recompiling the module! [WARNING] File encoding has not been set, using platform encoding UTF-8, i.e. build is platform dependent! [INFO] Compiling 102 source files to /home/marcus/git/ldbc_snb_datagen/target/classes [WARNING] /home/marcus/git/ldbc_snb_datagen/src/main/java/ldbc/socialnet/dbgen/serializer/CSVSerializer/CSVSerializer.java: Some input files use unchecked or unsafe operations. [WARNING] /home/marcus/git/ldbc_snb_datagen/src/main/java/ldbc/socialnet/dbgen/serializer/CSVSerializer/CSVSerializer.java: Recompile with -Xlint:unchecked for details. [INFO] [resources:testResources {execution: default-testResources}] [WARNING] Using platform encoding (UTF-8 actually) to copy filtered resources, i.e. build is platform dependent! [INFO] skip non existing resourceDirectory /home/marcus/git/ldbc_snb_datagen/src/test/resources [INFO] [compiler:testCompile {execution: default-testCompile}] [INFO] No sources to compile [INFO] [surefire:test {execution: default-test}] [INFO] No tests to run. [INFO] [jar:jar {execution: default-jar}] [INFO] Building jar: /home/marcus/git/ldbc_snb_datagen/target/ldbc_snb_datagen-0.1.jar [INFO] [assembly:assembly {execution: default-cli}] [INFO] Building jar: /home/marcus/git/ldbc_snb_datagen/target/ldbc_snb_datagen.jar [WARNING] Configuration options: 'appendAssemblyId' is set to false, and 'classifier' is missing. Instead of attaching the assembly file: /home/marcus/git/ldbc_snb_datagen/target/ldbc_snb_datagen.jar, it will become the file for main project artifact. NOTE: If multiple descriptors or descriptor-formats are provided for this project, the value of this file will be non-deterministic! [WARNING] Replacing pre-existing project main-artifact file: /home/marcus/git/ldbc_snb_datagen/target/ldbc_snb_datagen-0.1.jar with assembly file: /home/marcus/git/ldbc_snb_datagen/target/ldbc_snb_datagen.jar [INFO] ------------------------------------------------------------------------ [INFO] BUILD SUCCESSFUL [INFO] ------------------------------------------------------------------------ [INFO] Total time: 28 seconds [INFO] Finished at: Tue Oct 28 11:39:50 CET 2014 [INFO] Final Memory: 65M/1762M [INFO] ------------------------------------------------------------------------ Warning: $HADOOP_HOME is deprecated.

***** Configuration ***** scaleFactor: 1 numThreads: 6 serializer: csv compressed: false updateStreams: false outputDir: /home/marcus/data/ldbc numUpdatePartitions: 1

NUMBER OF THREADS 6

Starting: Person generation and friendship generation 1 *

14/10/28 11:39:54 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:39:55 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:39:55 INFO mapred.JobClient: Running job: job_201410280928_0023 14/10/28 11:39:56 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:40:07 INFO mapred.JobClient: map 33% reduce 0% 14/10/28 11:40:08 INFO mapred.JobClient: map 66% reduce 0% 14/10/28 11:40:09 INFO mapred.JobClient: map 83% reduce 0% 14/10/28 11:40:10 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:40:15 INFO mapred.JobClient: map 100% reduce 22% 14/10/28 11:40:16 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:40:18 INFO mapred.JobClient: map 100% reduce 61% 14/10/28 11:40:19 INFO mapred.JobClient: map 100% reduce 94% 14/10/28 11:40:21 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:40:22 INFO mapred.JobClient: Job complete: job_201410280928_0023 14/10/28 11:40:22 INFO mapred.JobClient: Counters: 28 14/10/28 11:40:22 INFO mapred.JobClient: Job Counters 14/10/28 11:40:22 INFO mapred.JobClient: Launched reduce tasks=6 14/10/28 11:40:22 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=40209 14/10/28 11:40:22 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:40:22 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:40:22 INFO mapred.JobClient: Launched map tasks=6 14/10/28 11:40:22 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=78058 14/10/28 11:40:22 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:40:22 INFO mapred.JobClient: Bytes Written=14905888 14/10/28 11:40:22 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:40:22 INFO mapred.JobClient: FILE_BYTES_READ=2611999 14/10/28 11:40:22 INFO mapred.JobClient: HDFS_BYTES_READ=821 14/10/28 11:40:22 INFO mapred.JobClient: FILE_BYTES_WRITTEN=5920286 14/10/28 11:40:22 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=14905888 14/10/28 11:40:22 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:40:22 INFO mapred.JobClient: Bytes Read=47 14/10/28 11:40:22 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:40:22 INFO mapred.JobClient: Map output materialized bytes=2612179 14/10/28 11:40:22 INFO mapred.JobClient: Map input records=6 14/10/28 11:40:22 INFO mapred.JobClient: Reduce shuffle bytes=2612179 14/10/28 11:40:22 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:40:22 INFO mapred.JobClient: Map output bytes=2575608 14/10/28 11:40:22 INFO mapred.JobClient: Total committed heap usage (bytes)=16475226112 14/10/28 11:40:22 INFO mapred.JobClient: CPU time spent (ms)=94810 14/10/28 11:40:22 INFO mapred.JobClient: Combine input records=0 14/10/28 11:40:22 INFO mapred.JobClient: SPLIT_RAW_BYTES=774 14/10/28 11:40:22 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:40:22 INFO mapred.JobClient: Reduce input groups=1 14/10/28 11:40:22 INFO mapred.JobClient: Combine output records=0 14/10/28 11:40:22 INFO mapred.JobClient: Physical memory (bytes) snapshot=12754886656 14/10/28 11:40:22 INFO mapred.JobClient: Reduce output records=11000 14/10/28 11:40:22 INFO mapred.JobClient: Virtual memory (bytes) snapshot=213573439488 14/10/28 11:40:22 INFO mapred.JobClient: Map output records=11000
Starting: Sorting by first dimension *

14/10/28 11:40:22 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:40:23 INFO input.FileInputFormat: Total input paths to process : 6 14/10/28 11:40:23 INFO mapred.JobClient: Running job: job_201410280928_0024 14/10/28 11:40:24 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:40:31 INFO mapred.JobClient: map 83% reduce 0% 14/10/28 11:40:32 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:40:38 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:40:40 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:40:41 INFO mapred.JobClient: Job complete: job_201410280928_0024 14/10/28 11:40:41 INFO mapred.JobClient: Counters: 29 14/10/28 11:40:41 INFO mapred.JobClient: Job Counters 14/10/28 11:40:41 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:40:41 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=13903 14/10/28 11:40:41 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:40:41 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:40:41 INFO mapred.JobClient: Launched map tasks=6 14/10/28 11:40:41 INFO mapred.JobClient: Data-local map tasks=6 14/10/28 11:40:41 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=9318 14/10/28 11:40:41 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:40:41 INFO mapred.JobClient: Bytes Written=14904463 14/10/28 11:40:41 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:40:41 INFO mapred.JobClient: FILE_BYTES_READ=14773223 14/10/28 11:40:41 INFO mapred.JobClient: HDFS_BYTES_READ=14906692 14/10/28 11:40:41 INFO mapred.JobClient: FILE_BYTES_WRITTEN=29953549 14/10/28 11:40:41 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=14904463 14/10/28 11:40:41 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:40:41 INFO mapred.JobClient: Bytes Read=14905888 14/10/28 11:40:41 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:40:41 INFO mapred.JobClient: Map output materialized bytes=14773253 14/10/28 11:40:41 INFO mapred.JobClient: Map input records=11000 14/10/28 11:40:41 INFO mapred.JobClient: Reduce shuffle bytes=14773253 14/10/28 11:40:41 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:40:41 INFO mapred.JobClient: Map output bytes=14730450 14/10/28 11:40:41 INFO mapred.JobClient: Total committed heap usage (bytes)=5317853184 14/10/28 11:40:41 INFO mapred.JobClient: CPU time spent (ms)=7260 14/10/28 11:40:41 INFO mapred.JobClient: Combine input records=0 14/10/28 11:40:41 INFO mapred.JobClient: SPLIT_RAW_BYTES=804 14/10/28 11:40:41 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:40:41 INFO mapred.JobClient: Reduce input groups=1 14/10/28 11:40:41 INFO mapred.JobClient: Combine output records=0 14/10/28 11:40:41 INFO mapred.JobClient: Physical memory (bytes) snapshot=1772773376 14/10/28 11:40:41 INFO mapred.JobClient: Reduce output records=11000 14/10/28 11:40:41 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124571406336 14/10/28 11:40:41 INFO mapred.JobClient: Map output records=11000
Starting: Friendship generation 2. *

14/10/28 11:40:41 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:40:41 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:40:41 INFO mapred.JobClient: Running job: job_201410280928_0025 14/10/28 11:40:42 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:40:50 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:40:57 INFO mapred.JobClient: map 100% reduce 11% 14/10/28 11:40:58 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:41:00 INFO mapred.JobClient: map 100% reduce 44% 14/10/28 11:41:01 INFO mapred.JobClient: map 100% reduce 88% 14/10/28 11:41:03 INFO mapred.JobClient: map 100% reduce 94% 14/10/28 11:41:04 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:41:04 INFO mapred.JobClient: Job complete: job_201410280928_0025 14/10/28 11:41:05 INFO mapred.JobClient: Counters: 29 14/10/28 11:41:05 INFO mapred.JobClient: Job Counters 14/10/28 11:41:05 INFO mapred.JobClient: Launched reduce tasks=6 14/10/28 11:41:05 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=5438 14/10/28 11:41:05 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:41:05 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:41:05 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:41:05 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:41:05 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=77411 14/10/28 11:41:05 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:41:05 INFO mapred.JobClient: Bytes Written=27049190 14/10/28 11:41:05 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:41:05 INFO mapred.JobClient: FILE_BYTES_READ=14773253 14/10/28 11:41:05 INFO mapred.JobClient: HDFS_BYTES_READ=14904604 14/10/28 11:41:05 INFO mapred.JobClient: FILE_BYTES_WRITTEN=29953240 14/10/28 11:41:05 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=27049190 14/10/28 11:41:05 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:41:05 INFO mapred.JobClient: Bytes Read=14904463 14/10/28 11:41:05 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:41:05 INFO mapred.JobClient: Map output materialized bytes=14773253 14/10/28 11:41:05 INFO mapred.JobClient: Map input records=11000 14/10/28 11:41:05 INFO mapred.JobClient: Reduce shuffle bytes=14773253 14/10/28 11:41:05 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:41:05 INFO mapred.JobClient: Map output bytes=14730450 14/10/28 11:41:05 INFO mapred.JobClient: Total committed heap usage (bytes)=9102163968 14/10/28 11:41:05 INFO mapred.JobClient: CPU time spent (ms)=51950 14/10/28 11:41:05 INFO mapred.JobClient: Combine input records=0 14/10/28 11:41:05 INFO mapred.JobClient: SPLIT_RAW_BYTES=141 14/10/28 11:41:05 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:41:05 INFO mapred.JobClient: Reduce input groups=2 14/10/28 11:41:05 INFO mapred.JobClient: Combine output records=0 14/10/28 11:41:05 INFO mapred.JobClient: Physical memory (bytes) snapshot=6022471680 14/10/28 11:41:05 INFO mapred.JobClient: Reduce output records=11000 14/10/28 11:41:05 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124569759744 14/10/28 11:41:05 INFO mapred.JobClient: Map output records=11000
Starting: Sorting by second dimension *

14/10/28 11:41:05 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:41:05 INFO input.FileInputFormat: Total input paths to process : 6 14/10/28 11:41:05 INFO mapred.JobClient: Running job: job_201410280928_0026 14/10/28 11:41:06 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:41:13 INFO mapred.JobClient: map 83% reduce 0% 14/10/28 11:41:15 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:41:20 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:41:22 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:41:23 INFO mapred.JobClient: Job complete: job_201410280928_0026 14/10/28 11:41:23 INFO mapred.JobClient: Counters: 29 14/10/28 11:41:23 INFO mapred.JobClient: Job Counters 14/10/28 11:41:23 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:41:23 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=14588 14/10/28 11:41:23 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:41:23 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:41:23 INFO mapred.JobClient: Launched map tasks=6 14/10/28 11:41:23 INFO mapred.JobClient: Data-local map tasks=6 14/10/28 11:41:23 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=9638 14/10/28 11:41:23 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:41:23 INFO mapred.JobClient: Bytes Written=27049165 14/10/28 11:41:23 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:41:23 INFO mapred.JobClient: FILE_BYTES_READ=26890619 14/10/28 11:41:23 INFO mapred.JobClient: HDFS_BYTES_READ=27050000 14/10/28 11:41:23 INFO mapred.JobClient: FILE_BYTES_WRITTEN=54188369 14/10/28 11:41:23 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=27049165 14/10/28 11:41:23 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:41:23 INFO mapred.JobClient: Bytes Read=27049190 14/10/28 11:41:23 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:41:23 INFO mapred.JobClient: Map output materialized bytes=26890649 14/10/28 11:41:23 INFO mapred.JobClient: Map input records=11000 14/10/28 11:41:23 INFO mapred.JobClient: Reduce shuffle bytes=26890649 14/10/28 11:41:23 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:41:23 INFO mapred.JobClient: Map output bytes=26847492 14/10/28 11:41:23 INFO mapred.JobClient: Total committed heap usage (bytes)=5317853184 14/10/28 11:41:23 INFO mapred.JobClient: CPU time spent (ms)=9250 14/10/28 11:41:23 INFO mapred.JobClient: Combine input records=0 14/10/28 11:41:23 INFO mapred.JobClient: SPLIT_RAW_BYTES=810 14/10/28 11:41:23 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:41:23 INFO mapred.JobClient: Reduce input groups=1 14/10/28 11:41:23 INFO mapred.JobClient: Combine output records=0 14/10/28 11:41:23 INFO mapred.JobClient: Physical memory (bytes) snapshot=1812287488 14/10/28 11:41:23 INFO mapred.JobClient: Reduce output records=11000 14/10/28 11:41:23 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124432502784 14/10/28 11:41:23 INFO mapred.JobClient: Map output records=11000
Starting: Friendship generation 3. *

14/10/28 11:41:23 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:41:24 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:41:24 INFO mapred.JobClient: Running job: job_201410280928_0027 14/10/28 11:41:25 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:41:33 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:41:41 INFO mapred.JobClient: map 100% reduce 22% 14/10/28 11:41:42 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:41:44 INFO mapred.JobClient: map 100% reduce 66% 14/10/28 11:41:45 INFO mapred.JobClient: map 100% reduce 88% 14/10/28 11:41:46 INFO mapred.JobClient: map 100% reduce 94% 14/10/28 11:41:47 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:41:48 INFO mapred.JobClient: Job complete: job_201410280928_0027 14/10/28 11:41:48 INFO mapred.JobClient: Counters: 29 14/10/28 11:41:48 INFO mapred.JobClient: Job Counters 14/10/28 11:41:48 INFO mapred.JobClient: Launched reduce tasks=6 14/10/28 11:41:48 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=5707 14/10/28 11:41:48 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:41:48 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:41:48 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:41:48 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:41:48 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=77141 14/10/28 11:41:48 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:41:48 INFO mapred.JobClient: Bytes Written=31300632 14/10/28 11:41:48 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:41:48 INFO mapred.JobClient: FILE_BYTES_READ=26890649 14/10/28 11:41:48 INFO mapred.JobClient: HDFS_BYTES_READ=27049307 14/10/28 11:41:48 INFO mapred.JobClient: FILE_BYTES_WRITTEN=54188025 14/10/28 11:41:48 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=31300632 14/10/28 11:41:48 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:41:48 INFO mapred.JobClient: Bytes Read=27049165 14/10/28 11:41:48 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:41:48 INFO mapred.JobClient: Map output materialized bytes=26890649 14/10/28 11:41:48 INFO mapred.JobClient: Map input records=11000 14/10/28 11:41:48 INFO mapred.JobClient: Reduce shuffle bytes=26890649 14/10/28 11:41:48 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:41:48 INFO mapred.JobClient: Map output bytes=26847492 14/10/28 11:41:48 INFO mapred.JobClient: Total committed heap usage (bytes)=9102688256 14/10/28 11:41:48 INFO mapred.JobClient: CPU time spent (ms)=52660 14/10/28 11:41:48 INFO mapred.JobClient: Combine input records=0 14/10/28 11:41:48 INFO mapred.JobClient: SPLIT_RAW_BYTES=142 14/10/28 11:41:48 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:41:48 INFO mapred.JobClient: Reduce input groups=2 14/10/28 11:41:48 INFO mapred.JobClient: Combine output records=0 14/10/28 11:41:48 INFO mapred.JobClient: Physical memory (bytes) snapshot=6044303360 14/10/28 11:41:48 INFO mapred.JobClient: Reduce output records=11000 14/10/28 11:41:48 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124648816640 14/10/28 11:41:48 INFO mapred.JobClient: Map output records=11000
Starting: Sorting by third dimension *

14/10/28 11:41:48 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:41:48 INFO input.FileInputFormat: Total input paths to process : 6 14/10/28 11:41:48 INFO mapred.JobClient: Running job: job_201410280928_0028 14/10/28 11:41:49 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:41:56 INFO mapred.JobClient: map 83% reduce 0% 14/10/28 11:41:58 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:42:03 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:42:06 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:42:06 INFO mapred.JobClient: Job complete: job_201410280928_0028 14/10/28 11:42:06 INFO mapred.JobClient: Counters: 29 14/10/28 11:42:06 INFO mapred.JobClient: Job Counters 14/10/28 11:42:06 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:42:06 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=14533 14/10/28 11:42:06 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:42:06 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:42:06 INFO mapred.JobClient: Launched map tasks=6 14/10/28 11:42:06 INFO mapred.JobClient: Data-local map tasks=6 14/10/28 11:42:06 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=9617 14/10/28 11:42:06 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:42:06 INFO mapred.JobClient: Bytes Written=31300087 14/10/28 11:42:06 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:42:06 INFO mapred.JobClient: FILE_BYTES_READ=31134319 14/10/28 11:42:06 INFO mapred.JobClient: HDFS_BYTES_READ=31301442 14/10/28 11:42:06 INFO mapred.JobClient: FILE_BYTES_WRITTEN=62675769 14/10/28 11:42:06 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=31300087 14/10/28 11:42:06 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:42:06 INFO mapred.JobClient: Bytes Read=31300632 14/10/28 11:42:06 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:42:06 INFO mapred.JobClient: Map output materialized bytes=31134349 14/10/28 11:42:06 INFO mapred.JobClient: Map input records=11000 14/10/28 11:42:06 INFO mapred.JobClient: Reduce shuffle bytes=31134349 14/10/28 11:42:06 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:42:06 INFO mapred.JobClient: Map output bytes=31090794 14/10/28 11:42:06 INFO mapred.JobClient: Total committed heap usage (bytes)=5317853184 14/10/28 11:42:06 INFO mapred.JobClient: CPU time spent (ms)=8670 14/10/28 11:42:06 INFO mapred.JobClient: Combine input records=0 14/10/28 11:42:06 INFO mapred.JobClient: SPLIT_RAW_BYTES=810 14/10/28 11:42:06 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:42:06 INFO mapred.JobClient: Reduce input groups=1 14/10/28 11:42:06 INFO mapred.JobClient: Combine output records=0 14/10/28 11:42:06 INFO mapred.JobClient: Physical memory (bytes) snapshot=1789587456 14/10/28 11:42:06 INFO mapred.JobClient: Reduce output records=11000 14/10/28 11:42:06 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124557344768 14/10/28 11:42:06 INFO mapred.JobClient: Map output records=11000
Starting: Generating person activity *

14/10/28 11:42:06 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:42:07 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:42:07 INFO mapred.JobClient: Running job: job_201410280928_0029 14/10/28 11:42:08 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:42:16 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:42:24 INFO mapred.JobClient: map 100% reduce 16% 14/10/28 11:42:25 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:42:27 INFO mapred.JobClient: map 100% reduce 55% 14/10/28 11:42:28 INFO mapred.JobClient: map 100% reduce 88% 14/10/28 11:42:30 INFO mapred.JobClient: map 100% reduce 89% 14/10/28 11:42:33 INFO mapred.JobClient: map 100% reduce 90% 14/10/28 11:42:36 INFO mapred.JobClient: map 100% reduce 92% 14/10/28 11:42:39 INFO mapred.JobClient: map 100% reduce 94% 14/10/28 11:42:42 INFO mapred.JobClient: map 100% reduce 95% 14/10/28 11:42:57 INFO mapred.JobClient: map 100% reduce 96% 14/10/28 11:43:13 INFO mapred.JobClient: map 100% reduce 97% 14/10/28 11:43:28 INFO mapred.JobClient: map 100% reduce 98% 14/10/28 11:43:43 INFO mapred.JobClient: map 100% reduce 99% 14/10/28 11:43:58 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:43:58 INFO mapred.JobClient: Job complete: job_201410280928_0029 14/10/28 11:43:58 INFO mapred.JobClient: Counters: 29 14/10/28 11:43:58 INFO mapred.JobClient: Job Counters 14/10/28 11:43:58 INFO mapred.JobClient: Launched reduce tasks=6 14/10/28 11:43:58 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=6016 14/10/28 11:43:58 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:43:58 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:43:58 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:43:58 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:43:58 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=183506 14/10/28 11:43:58 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:43:58 INFO mapred.JobClient: Bytes Written=678 14/10/28 11:43:58 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:43:58 INFO mapred.JobClient: FILE_BYTES_READ=31134349 14/10/28 11:43:58 INFO mapred.JobClient: HDFS_BYTES_READ=31300229 14/10/28 11:43:58 INFO mapred.JobClient: FILE_BYTES_WRITTEN=62675376 14/10/28 11:43:58 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=1150748566 14/10/28 11:43:58 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:43:58 INFO mapred.JobClient: Bytes Read=31300087 14/10/28 11:43:58 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:43:58 INFO mapred.JobClient: Map output materialized bytes=31134349 14/10/28 11:43:58 INFO mapred.JobClient: Map input records=11000 14/10/28 11:43:58 INFO mapred.JobClient: Reduce shuffle bytes=31134349 14/10/28 11:43:58 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:43:58 INFO mapred.JobClient: Map output bytes=31090794 14/10/28 11:43:58 INFO mapred.JobClient: Total committed heap usage (bytes)=13463191552 14/10/28 11:43:58 INFO mapred.JobClient: CPU time spent (ms)=170690 14/10/28 11:43:58 INFO mapred.JobClient: Combine input records=0 14/10/28 11:43:58 INFO mapred.JobClient: SPLIT_RAW_BYTES=142 14/10/28 11:43:58 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:43:58 INFO mapred.JobClient: Reduce input groups=2 14/10/28 11:43:58 INFO mapred.JobClient: Combine output records=0 14/10/28 11:43:58 INFO mapred.JobClient: Physical memory (bytes) snapshot=12543287296 14/10/28 11:43:58 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:43:58 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124934160384 14/10/28 11:43:58 INFO mapred.JobClient: Map output records=11000
Starting: Sorting update streams *

14/10/28 11:43:58 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:43:58 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:43:58 INFO mapred.JobClient: Running job: job_201410280928_0030 14/10/28 11:43:59 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:44:06 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:44:13 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:44:14 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:44:15 INFO mapred.JobClient: Job complete: job_201410280928_0030 14/10/28 11:44:15 INFO mapred.JobClient: Counters: 29 14/10/28 11:44:15 INFO mapred.JobClient: Job Counters 14/10/28 11:44:15 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:44:15 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4109 14/10/28 11:44:15 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:44:15 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:44:15 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:44:15 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:44:15 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8491 14/10/28 11:44:15 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:44:15 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:44:15 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:44:15 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:44:15 INFO mapred.JobClient: HDFS_BYTES_READ=239 14/10/28 11:44:15 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115950 14/10/28 11:44:15 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:44:15 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:44:15 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:44:15 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:44:15 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:44:15 INFO mapred.JobClient: Map input records=0 14/10/28 11:44:15 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:44:15 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:44:15 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:44:15 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:44:15 INFO mapred.JobClient: CPU time spent (ms)=1500 14/10/28 11:44:15 INFO mapred.JobClient: Combine input records=0 14/10/28 11:44:15 INFO mapred.JobClient: SPLIT_RAW_BYTES=153 14/10/28 11:44:15 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:44:15 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:44:15 INFO mapred.JobClient: Combine output records=0 14/10/28 11:44:15 INFO mapred.JobClient: Physical memory (bytes) snapshot=400809984 14/10/28 11:44:15 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:44:15 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35613175808 14/10/28 11:44:15 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:44:15 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:44:16 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:44:16 INFO mapred.JobClient: Running job: job_201410280928_0031 14/10/28 11:44:17 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:44:23 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:44:31 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:44:32 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:44:32 INFO mapred.JobClient: Job complete: job_201410280928_0031 14/10/28 11:44:32 INFO mapred.JobClient: Counters: 29 14/10/28 11:44:32 INFO mapred.JobClient: Job Counters 14/10/28 11:44:32 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:44:32 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4202 14/10/28 11:44:32 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:44:32 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:44:32 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:44:32 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:44:32 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8480 14/10/28 11:44:32 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:44:32 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:44:32 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:44:32 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:44:32 INFO mapred.JobClient: HDFS_BYTES_READ=240 14/10/28 11:44:32 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115954 14/10/28 11:44:32 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:44:32 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:44:32 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:44:32 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:44:32 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:44:32 INFO mapred.JobClient: Map input records=0 14/10/28 11:44:32 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:44:32 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:44:32 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:44:32 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:44:32 INFO mapred.JobClient: CPU time spent (ms)=1420 14/10/28 11:44:32 INFO mapred.JobClient: Combine input records=0 14/10/28 11:44:32 INFO mapred.JobClient: SPLIT_RAW_BYTES=154 14/10/28 11:44:32 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:44:32 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:44:32 INFO mapred.JobClient: Combine output records=0 14/10/28 11:44:32 INFO mapred.JobClient: Physical memory (bytes) snapshot=401121280 14/10/28 11:44:32 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:44:32 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35608977408 14/10/28 11:44:32 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:44:32 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:44:32 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:44:32 INFO mapred.JobClient: Running job: job_201410280928_0032 14/10/28 11:44:33 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:44:39 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:44:47 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:44:48 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:44:48 INFO mapred.JobClient: Job complete: job_201410280928_0032 14/10/28 11:44:48 INFO mapred.JobClient: Counters: 29 14/10/28 11:44:48 INFO mapred.JobClient: Job Counters 14/10/28 11:44:48 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:44:48 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4086 14/10/28 11:44:48 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:44:48 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:44:48 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:44:48 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:44:48 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8500 14/10/28 11:44:48 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:44:48 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:44:48 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:44:48 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:44:48 INFO mapred.JobClient: HDFS_BYTES_READ=239 14/10/28 11:44:48 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115950 14/10/28 11:44:48 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:44:48 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:44:48 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:44:48 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:44:48 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:44:48 INFO mapred.JobClient: Map input records=0 14/10/28 11:44:48 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:44:48 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:44:48 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:44:48 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:44:48 INFO mapred.JobClient: CPU time spent (ms)=1480 14/10/28 11:44:48 INFO mapred.JobClient: Combine input records=0 14/10/28 11:44:48 INFO mapred.JobClient: SPLIT_RAW_BYTES=153 14/10/28 11:44:48 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:44:48 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:44:48 INFO mapred.JobClient: Combine output records=0 14/10/28 11:44:48 INFO mapred.JobClient: Physical memory (bytes) snapshot=399106048 14/10/28 11:44:48 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:44:48 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35556962304 14/10/28 11:44:48 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:44:48 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:44:49 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:44:49 INFO mapred.JobClient: Running job: job_201410280928_0033 14/10/28 11:44:50 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:44:57 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:45:04 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:45:05 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:45:06 INFO mapred.JobClient: Job complete: job_201410280928_0033 14/10/28 11:45:06 INFO mapred.JobClient: Counters: 29 14/10/28 11:45:06 INFO mapred.JobClient: Job Counters 14/10/28 11:45:06 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:45:06 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4079 14/10/28 11:45:06 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:45:06 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:45:06 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:45:06 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:45:06 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8503 14/10/28 11:45:06 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:45:06 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:45:06 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:45:06 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:45:06 INFO mapred.JobClient: HDFS_BYTES_READ=240 14/10/28 11:45:06 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115954 14/10/28 11:45:06 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:45:06 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:45:06 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:45:06 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:45:06 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:45:06 INFO mapred.JobClient: Map input records=0 14/10/28 11:45:06 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:45:06 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:45:06 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:45:06 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:45:06 INFO mapred.JobClient: CPU time spent (ms)=1410 14/10/28 11:45:06 INFO mapred.JobClient: Combine input records=0 14/10/28 11:45:06 INFO mapred.JobClient: SPLIT_RAW_BYTES=154 14/10/28 11:45:06 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:45:06 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:45:06 INFO mapred.JobClient: Combine output records=0 14/10/28 11:45:06 INFO mapred.JobClient: Physical memory (bytes) snapshot=402268160 14/10/28 11:45:06 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:45:06 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35611058176 14/10/28 11:45:06 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:45:06 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:45:06 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:45:06 INFO mapred.JobClient: Running job: job_201410280928_0034 14/10/28 11:45:07 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:45:13 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:45:21 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:45:22 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:45:22 INFO mapred.JobClient: Job complete: job_201410280928_0034 14/10/28 11:45:22 INFO mapred.JobClient: Counters: 29 14/10/28 11:45:22 INFO mapred.JobClient: Job Counters 14/10/28 11:45:22 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:45:22 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4072 14/10/28 11:45:22 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:45:22 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:45:22 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:45:22 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:45:22 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8500 14/10/28 11:45:22 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:45:22 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:45:22 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:45:22 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:45:22 INFO mapred.JobClient: HDFS_BYTES_READ=239 14/10/28 11:45:22 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115950 14/10/28 11:45:22 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:45:22 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:45:22 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:45:22 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:45:22 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:45:22 INFO mapred.JobClient: Map input records=0 14/10/28 11:45:22 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:45:22 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:45:22 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:45:22 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:45:22 INFO mapred.JobClient: CPU time spent (ms)=1410 14/10/28 11:45:22 INFO mapred.JobClient: Combine input records=0 14/10/28 11:45:22 INFO mapred.JobClient: SPLIT_RAW_BYTES=153 14/10/28 11:45:22 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:45:22 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:45:22 INFO mapred.JobClient: Combine output records=0 14/10/28 11:45:22 INFO mapred.JobClient: Physical memory (bytes) snapshot=395481088 14/10/28 11:45:22 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:45:22 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35490246656 14/10/28 11:45:22 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:45:22 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:45:23 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:45:23 INFO mapred.JobClient: Running job: job_201410280928_0035 14/10/28 11:45:24 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:45:31 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:45:38 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:45:39 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:45:40 INFO mapred.JobClient: Job complete: job_201410280928_0035 14/10/28 11:45:40 INFO mapred.JobClient: Counters: 29 14/10/28 11:45:40 INFO mapred.JobClient: Job Counters 14/10/28 11:45:40 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:45:40 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4123 14/10/28 11:45:40 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:45:40 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:45:40 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:45:40 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:45:40 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8491 14/10/28 11:45:40 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:45:40 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:45:40 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:45:40 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:45:40 INFO mapred.JobClient: HDFS_BYTES_READ=240 14/10/28 11:45:40 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115954 14/10/28 11:45:40 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:45:40 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:45:40 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:45:40 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:45:40 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:45:40 INFO mapred.JobClient: Map input records=0 14/10/28 11:45:40 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:45:40 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:45:40 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:45:40 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:45:40 INFO mapred.JobClient: CPU time spent (ms)=1430 14/10/28 11:45:40 INFO mapred.JobClient: Combine input records=0 14/10/28 11:45:40 INFO mapred.JobClient: SPLIT_RAW_BYTES=154 14/10/28 11:45:40 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:45:40 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:45:40 INFO mapred.JobClient: Combine output records=0 14/10/28 11:45:40 INFO mapred.JobClient: Physical memory (bytes) snapshot=394846208 14/10/28 11:45:40 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:45:40 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35617841152 14/10/28 11:45:40 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:45:40 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:45:40 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:45:41 INFO mapred.JobClient: Running job: job_201410280928_0036 14/10/28 11:45:42 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:45:48 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:45:56 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:45:57 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:45:58 INFO mapred.JobClient: Job complete: job_201410280928_0036 14/10/28 11:45:58 INFO mapred.JobClient: Counters: 29 14/10/28 11:45:58 INFO mapred.JobClient: Job Counters 14/10/28 11:45:58 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:45:58 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4097 14/10/28 11:45:58 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:45:58 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:45:58 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:45:58 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:45:58 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8617 14/10/28 11:45:58 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:45:58 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:45:58 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:45:58 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:45:58 INFO mapred.JobClient: HDFS_BYTES_READ=239 14/10/28 11:45:58 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115950 14/10/28 11:45:58 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:45:58 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:45:58 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:45:58 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:45:58 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:45:58 INFO mapred.JobClient: Map input records=0 14/10/28 11:45:58 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:45:58 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:45:58 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:45:58 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:45:58 INFO mapred.JobClient: CPU time spent (ms)=1470 14/10/28 11:45:58 INFO mapred.JobClient: Combine input records=0 14/10/28 11:45:58 INFO mapred.JobClient: SPLIT_RAW_BYTES=153 14/10/28 11:45:58 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:45:58 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:45:58 INFO mapred.JobClient: Combine output records=0 14/10/28 11:45:58 INFO mapred.JobClient: Physical memory (bytes) snapshot=398942208 14/10/28 11:45:58 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:45:58 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35622834176 14/10/28 11:45:58 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:45:58 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:45:58 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:45:58 INFO mapred.JobClient: Running job: job_201410280928_0037 14/10/28 11:45:59 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:46:06 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:46:13 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:46:14 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:46:15 INFO mapred.JobClient: Job complete: job_201410280928_0037 14/10/28 11:46:15 INFO mapred.JobClient: Counters: 29 14/10/28 11:46:15 INFO mapred.JobClient: Job Counters 14/10/28 11:46:15 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:46:15 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4095 14/10/28 11:46:15 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:46:15 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:46:15 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:46:15 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:46:15 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8515 14/10/28 11:46:15 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:46:15 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:46:15 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:46:15 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:46:15 INFO mapred.JobClient: HDFS_BYTES_READ=240 14/10/28 11:46:15 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115954 14/10/28 11:46:15 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:46:15 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:46:15 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:46:15 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:46:15 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:46:15 INFO mapred.JobClient: Map input records=0 14/10/28 11:46:15 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:46:15 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:46:15 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:46:15 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:46:15 INFO mapred.JobClient: CPU time spent (ms)=1440 14/10/28 11:46:15 INFO mapred.JobClient: Combine input records=0 14/10/28 11:46:15 INFO mapred.JobClient: SPLIT_RAW_BYTES=154 14/10/28 11:46:15 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:46:15 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:46:15 INFO mapred.JobClient: Combine output records=0 14/10/28 11:46:15 INFO mapred.JobClient: Physical memory (bytes) snapshot=400273408 14/10/28 11:46:15 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:46:15 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35612233728 14/10/28 11:46:15 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:46:15 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:46:16 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:46:16 INFO mapred.JobClient: Running job: job_201410280928_0038 14/10/28 11:46:17 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:46:23 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:46:31 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:46:32 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:46:33 INFO mapred.JobClient: Job complete: job_201410280928_0038 14/10/28 11:46:33 INFO mapred.JobClient: Counters: 29 14/10/28 11:46:33 INFO mapred.JobClient: Job Counters 14/10/28 11:46:33 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:46:33 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4168 14/10/28 11:46:33 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:46:33 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:46:33 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:46:33 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:46:33 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8531 14/10/28 11:46:33 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:46:33 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:46:33 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:46:33 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:46:33 INFO mapred.JobClient: HDFS_BYTES_READ=239 14/10/28 11:46:33 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115950 14/10/28 11:46:33 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:46:33 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:46:33 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:46:33 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:46:33 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:46:33 INFO mapred.JobClient: Map input records=0 14/10/28 11:46:33 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:46:33 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:46:33 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:46:33 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:46:33 INFO mapred.JobClient: CPU time spent (ms)=1440 14/10/28 11:46:33 INFO mapred.JobClient: Combine input records=0 14/10/28 11:46:33 INFO mapred.JobClient: SPLIT_RAW_BYTES=153 14/10/28 11:46:33 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:46:33 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:46:33 INFO mapred.JobClient: Combine output records=0 14/10/28 11:46:33 INFO mapred.JobClient: Physical memory (bytes) snapshot=403955712 14/10/28 11:46:33 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:46:33 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35614060544 14/10/28 11:46:33 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:46:33 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:46:33 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:46:33 INFO mapred.JobClient: Running job: job_201410280928_0039 14/10/28 11:46:34 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:46:40 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:46:48 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:46:49 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:46:49 INFO mapred.JobClient: Job complete: job_201410280928_0039 14/10/28 11:46:49 INFO mapred.JobClient: Counters: 29 14/10/28 11:46:49 INFO mapred.JobClient: Job Counters 14/10/28 11:46:49 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:46:49 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4095 14/10/28 11:46:49 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:46:49 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:46:49 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:46:49 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:46:49 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8494 14/10/28 11:46:49 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:46:49 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:46:49 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:46:49 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:46:49 INFO mapred.JobClient: HDFS_BYTES_READ=240 14/10/28 11:46:49 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115954 14/10/28 11:46:49 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:46:49 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:46:49 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:46:49 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:46:49 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:46:49 INFO mapred.JobClient: Map input records=0 14/10/28 11:46:49 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:46:49 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:46:49 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:46:49 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:46:49 INFO mapred.JobClient: CPU time spent (ms)=1400 14/10/28 11:46:49 INFO mapred.JobClient: Combine input records=0 14/10/28 11:46:49 INFO mapred.JobClient: SPLIT_RAW_BYTES=154 14/10/28 11:46:49 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:46:49 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:46:49 INFO mapred.JobClient: Combine output records=0 14/10/28 11:46:49 INFO mapred.JobClient: Physical memory (bytes) snapshot=395313152 14/10/28 11:46:49 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:46:49 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35612045312 14/10/28 11:46:49 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:46:50 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:46:50 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:46:50 INFO mapred.JobClient: Running job: job_201410280928_0040 14/10/28 11:46:51 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:46:57 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:47:05 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:47:06 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:47:07 INFO mapred.JobClient: Job complete: job_201410280928_0040 14/10/28 11:47:07 INFO mapred.JobClient: Counters: 29 14/10/28 11:47:07 INFO mapred.JobClient: Job Counters 14/10/28 11:47:07 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:47:07 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4120 14/10/28 11:47:07 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:47:07 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:47:07 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:47:07 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:47:07 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8508 14/10/28 11:47:07 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:47:07 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:47:07 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:47:07 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:47:07 INFO mapred.JobClient: HDFS_BYTES_READ=239 14/10/28 11:47:07 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115950 14/10/28 11:47:07 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:47:07 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:47:07 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:47:07 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:47:07 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:47:07 INFO mapred.JobClient: Map input records=0 14/10/28 11:47:07 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:47:07 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:47:07 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:47:07 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:47:07 INFO mapred.JobClient: CPU time spent (ms)=1410 14/10/28 11:47:07 INFO mapred.JobClient: Combine input records=0 14/10/28 11:47:07 INFO mapred.JobClient: SPLIT_RAW_BYTES=153 14/10/28 11:47:07 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:47:07 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:47:07 INFO mapred.JobClient: Combine output records=0 14/10/28 11:47:07 INFO mapred.JobClient: Physical memory (bytes) snapshot=397578240 14/10/28 11:47:07 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:47:07 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35615576064 14/10/28 11:47:07 INFO mapred.JobClient: Map output records=0
Starting: Sorting update streams *

14/10/28 11:47:07 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:47:08 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:47:08 INFO mapred.JobClient: Running job: job_201410280928_0041 14/10/28 11:47:09 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:47:16 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:47:23 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:47:24 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:47:25 INFO mapred.JobClient: Job complete: job_201410280928_0041 14/10/28 11:47:25 INFO mapred.JobClient: Counters: 29 14/10/28 11:47:25 INFO mapred.JobClient: Job Counters 14/10/28 11:47:25 INFO mapred.JobClient: Launched reduce tasks=1 14/10/28 11:47:25 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=4090 14/10/28 11:47:25 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:47:25 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:47:25 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:47:25 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:47:25 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=8541 14/10/28 11:47:25 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:47:25 INFO mapred.JobClient: Bytes Written=86 14/10/28 11:47:25 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:47:25 INFO mapred.JobClient: FILE_BYTES_READ=6 14/10/28 11:47:25 INFO mapred.JobClient: HDFS_BYTES_READ=240 14/10/28 11:47:25 INFO mapred.JobClient: FILE_BYTES_WRITTEN=115954 14/10/28 11:47:25 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=86 14/10/28 11:47:25 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:47:25 INFO mapred.JobClient: Bytes Read=86 14/10/28 11:47:25 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:47:25 INFO mapred.JobClient: Map output materialized bytes=6 14/10/28 11:47:25 INFO mapred.JobClient: Map input records=0 14/10/28 11:47:25 INFO mapred.JobClient: Reduce shuffle bytes=6 14/10/28 11:47:25 INFO mapred.JobClient: Spilled Records=0 14/10/28 11:47:25 INFO mapred.JobClient: Map output bytes=0 14/10/28 11:47:25 INFO mapred.JobClient: Total committed heap usage (bytes)=1519386624 14/10/28 11:47:25 INFO mapred.JobClient: CPU time spent (ms)=1430 14/10/28 11:47:25 INFO mapred.JobClient: Combine input records=0 14/10/28 11:47:25 INFO mapred.JobClient: SPLIT_RAW_BYTES=154 14/10/28 11:47:25 INFO mapred.JobClient: Reduce input records=0 14/10/28 11:47:25 INFO mapred.JobClient: Reduce input groups=0 14/10/28 11:47:25 INFO mapred.JobClient: Combine output records=0 14/10/28 11:47:25 INFO mapred.JobClient: Physical memory (bytes) snapshot=402501632 14/10/28 11:47:25 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:47:25 INFO mapred.JobClient: Virtual memory (bytes) snapshot=35617918976 14/10/28 11:47:25 INFO mapred.JobClient: Map output records=0
Starting: Materialize friends for substitution parameters *

14/10/28 11:47:25 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. 14/10/28 11:47:25 INFO input.FileInputFormat: Total input paths to process : 1 14/10/28 11:47:25 INFO mapred.JobClient: Running job: job_201410280928_0042 14/10/28 11:47:26 INFO mapred.JobClient: map 0% reduce 0% 14/10/28 11:47:34 INFO mapred.JobClient: map 100% reduce 0% 14/10/28 11:47:42 INFO mapred.JobClient: map 100% reduce 16% 14/10/28 11:47:43 INFO mapred.JobClient: map 100% reduce 33% 14/10/28 11:47:44 INFO mapred.JobClient: map 100% reduce 88% 14/10/28 11:47:45 INFO mapred.JobClient: map 100% reduce 100% 14/10/28 11:47:45 INFO mapred.JobClient: Job complete: job_201410280928_0042 14/10/28 11:47:45 INFO mapred.JobClient: Counters: 29 14/10/28 11:47:45 INFO mapred.JobClient: Job Counters 14/10/28 11:47:45 INFO mapred.JobClient: Launched reduce tasks=6 14/10/28 11:47:45 INFO mapred.JobClient: SLOTS_MILLIS_MAPS=5913 14/10/28 11:47:45 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)=0 14/10/28 11:47:45 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)=0 14/10/28 11:47:45 INFO mapred.JobClient: Launched map tasks=1 14/10/28 11:47:45 INFO mapred.JobClient: Data-local map tasks=1 14/10/28 11:47:45 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES=52355 14/10/28 11:47:45 INFO mapred.JobClient: File Output Format Counters 14/10/28 11:47:45 INFO mapred.JobClient: Bytes Written=678 14/10/28 11:47:45 INFO mapred.JobClient: FileSystemCounters 14/10/28 11:47:45 INFO mapred.JobClient: FILE_BYTES_READ=31134349 14/10/28 11:47:45 INFO mapred.JobClient: HDFS_BYTES_READ=31300229 14/10/28 11:47:45 INFO mapred.JobClient: FILE_BYTES_WRITTEN=62675404 14/10/28 11:47:45 INFO mapred.JobClient: HDFS_BYTES_WRITTEN=6506313 14/10/28 11:47:45 INFO mapred.JobClient: File Input Format Counters 14/10/28 11:47:45 INFO mapred.JobClient: Bytes Read=31300087 14/10/28 11:47:45 INFO mapred.JobClient: Map-Reduce Framework 14/10/28 11:47:45 INFO mapred.JobClient: Map output materialized bytes=31134349 14/10/28 11:47:45 INFO mapred.JobClient: Map input records=11000 14/10/28 11:47:45 INFO mapred.JobClient: Reduce shuffle bytes=31134349 14/10/28 11:47:45 INFO mapred.JobClient: Spilled Records=22000 14/10/28 11:47:45 INFO mapred.JobClient: Map output bytes=31090794 14/10/28 11:47:45 INFO mapred.JobClient: Total committed heap usage (bytes)=5317853184 14/10/28 11:47:45 INFO mapred.JobClient: CPU time spent (ms)=12070 14/10/28 11:47:45 INFO mapred.JobClient: Combine input records=0 14/10/28 11:47:45 INFO mapred.JobClient: SPLIT_RAW_BYTES=142 14/10/28 11:47:45 INFO mapred.JobClient: Reduce input records=11000 14/10/28 11:47:45 INFO mapred.JobClient: Reduce input groups=2 14/10/28 11:47:45 INFO mapred.JobClient: Combine output records=0 14/10/28 11:47:45 INFO mapred.JobClient: Physical memory (bytes) snapshot=1492398080 14/10/28 11:47:45 INFO mapred.JobClient: Reduce output records=0 14/10/28 11:47:45 INFO mapred.JobClient: Virtual memory (bytes) snapshot=124615680000 14/10/28 11:47:45 INFO mapred.JobClient: Map output records=11000 471 total seconds 14/10/28 11:47:45 INFO util.NativeCodeLoader: Loaded the native-hadoop library loading input for parameter generation find parameter bindings for Persons find parameter bindings for Countries find parameter bindings for Tags find parameter bindings for Timestamps

ArnauPrat commented 10 years ago

have you checked what there is inside HDFS, using the following command? hadoop fs -ls /

MarcusParadies commented 10 years ago

Aha! I think I know where the confusion comes from. I was expecting that the generated data files will be copied (similar to the substitution_parameters) to the directory specified by 'outputDir'. Apparently, this folder is not a local folder but a HDFS folder.

So the copy from HDFS to the local file system is not part of the generation process but has to be done by the user in a separate step.

When I now read the documentation again, it makes sense. Maybe you can describe the data output generation a bit more in detail (https://github.com/ldbc/ldbc_snb_datagen/wiki/Data-Output).

So if you are ok with that, we can close this "issue". :-)

ArnauPrat commented 10 years ago

hahaha good news then :+1: We will try to improve that part in the documentation Thx!

ldbc-dev / ldbc_snb_datagen_deprecated2015

Data doesn't get serialized from HDFS #19