df.saveToMongodb is saving data in a wrong format.

Stratio / Spark-MongoDB

Spark library for easy MongoDB access

Apache License 2.0

307 stars 99 forks source link

Trying to save a DataFrame into MongoDB : val event = """{"Dev":[{"a":3},{"b":3}],"hr":[{"a":6}]}""" val events = sc.parallelize(event :: Nil) val df = sqlc.read.json(events) val saveConfig = MongodbConfigBuilder(Map(Host -> List("localhost:27017"), Database -> "test", Collection -> "test", SamplingRatio -> 1.0, WriteConcern -> "normal", SplitSize -> 8, SplitKey -> "_id")) df.saveToMongodb(saveConfig.build)

and that is what actually saved : { "_id" : ObjectId("57cedf4bd244c56e8e783a45"), "Dev" : [ { "a" : NumberLong(3), "b" : null }, { "a" : null, "b" : NumberLong(3) } ], "hr" : [ { "a" : NumberLong(6) } ] }

Stratio / Spark-MongoDB

df.saveToMongodb is saving data in a wrong format. #156