Converting taxi_agg table to JSON

MjHow912 commented 7 years ago

After running the Taxi_demo results in Hive, I want to convert the table back to JSON so that I can export it to a shared location and have my users can access it and open in ArcMap. I cannot use the copy tool in ArcMap because my cluster is kerberized and opens more troubles. It's a better process for me to convert the output back to JSON. Has anyone discovered how to do so?

randallwhitman commented 7 years ago

Use the EsriJsonSerDe - see the trip-discovery sample (but use the Spatial-Framework-v2 names - the sample needs update for that).

MjHow912 commented 7 years ago

So if table was created and saved in hive as: CREATE TABLE taxi_agg(area BINARY, count DOUBLE) ROW FORMAT SERDE 'com.esri.hadoop.hive.serde.JsonSerde'
STORED AS INPUTFORMAT 'com.esri.json.hadoop.UnenclosedJsonInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat';

To get back to JSON format for exporting, I found this code and altered it a bit: ALTER TABLE taxi_agg SET FILEFORMAT INPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' OUTPUTFORMAT 'com.esri.json.hadoop.EnclosedJsonInputFormat' SERDE 'com.esri.hadoop.hive.serde.EsriJsonSerDe';

Error: FAILED: SemanticeException Cannot find class 'com.esri.hadoop.hive.serde.EsriJsonSerDe

I also tried: ALTER TABLE test15json SET FILEFORMAT INPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' OUTPUTFORMAT 'com.esri.json.hadoop.EnclosedJsonInputFormat' ROW FORMAT SERDE 'com.esri.hadoop.hive.serde.EsriJsonSerDe';

Error: MismatchedTokenException(226!=233) at org.antlr.runtime.BaseRecognizer.recoverFromMismatchedToken(BaseRecognizer.java:617) at org.antlr.runtime.BaseRecognizer.match(BaseRecognizer.java:115) at org.apache.hadoop.hive.ql.parse.HiveParser.fileFormat(HiveParser.java:15604) at org.apache.hadoop.hive.ql.parse.HiveParser.alterStatementSuffixFileFormat(HiveParser.java:12890) at org.apache.hadoop.hive.ql.parse.HiveParser.alterTblPartitionStatementSuffix(HiveParser.java:8406) at org.apache.hadoop.hive.ql.parse.HiveParser.alterTableStatementSuffix(HiveParser.java:8159) at org.apache.hadoop.hive.ql.parse.HiveParser.alterStatement(HiveParser.java:7433) at org.apache.hadoop.hive.ql.parse.HiveParser.ddlStatement(HiveParser.java:2702) at org.apache.hadoop.hive.ql.parse.HiveParser.execStatement(HiveParser.java:1665) at org.apache.hadoop.hive.ql.parse.HiveParser.statement(HiveParser.java:1122) at org.apache.hadoop.hive.ql.parse.ParseDriver.parse(ParseDriver.java:202) at org.apache.hadoop.hive.ql.parse.ParseDriver.parse(ParseDriver.java:166) at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:437) at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:320) at org.apache.hadoop.hive.ql.Driver.compileInternal(Driver.java:1219) at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1260) at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1156) at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1146) at org.apache.hadoop.hive.cli.CliDriver.processLocalCmd(CliDriver.java:217) at org.apache.hadoop.hive.cli.CliDriver.processCmd(CliDriver.java:169) at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:380) at org.apache.hadoop.hive.cli.CliDriver.executeDriver(CliDriver.java:740) at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:685) at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:625) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:498) at org.apache.hadoop.util.RunJar.run(RunJar.java:233) at org.apache.hadoop.util.RunJar.main(RunJar.java:148) FAILED: ParseException line 4:1 mismatched input 'ROW' expecting SERDE near ''com.esri.json.hadoop.UnenclosedJsonInputFormat'' in file format specification

Any suggestions on what to try?

randallwhitman commented 7 years ago

Get Spatial Framework v2

MjHow912 commented 6 years ago

@randallwhitman Installed. And tabled altered. I still run into the problem of exporting it though. The webhdfs is going to work because of authenticating to a kerberized cluster. If I don't use the ArcMap tool of copying from hdfs and turn into JSON, can it be done manually? arg