不好意思作者能不能问一下数据的格式是怎么样的

bojone / bert_in_keras

在Keras下微调Bert的一些例子；some examples of bert in keras

657 stars 236 forks source link

不好意思作者能不能问一下数据的格式是怎么样的 #3

Closed chenbaicheng closed 5 years ago

chenbaicheng commented 5 years ago

苏大能不能给个数据例子出来就一个就行好像关系抽取 relation_extract.py 那个前面两个将多行json塞进数组能理解
但是这句就不懂了 id2predicate, predicate2id = json.load(open('../datasets/all_50_schemas_me.json')) 原本的数据是 {"object_type": "地点", "predicate": "祖籍", "subject_type": "人物"} {"object_type": "人物", "predicate": "父亲", "subject_type": "人物"}

怎么处理呢谢谢

chenbaicheng commented 5 years ago

给一个数据的模板不会被人说侵权的不表现出数据就好了这样也方便造自己的数据

ZihaoGENG commented 5 years ago

给一个数据的模板不会被人说侵权的不表现出数据就好了这样也方便造自己的数据

搜一下百度2019信息抽取，又不是搜不到

chenbaicheng commented 5 years ago

@ZihaoGENG 谢谢回复上面的格式就是找到的all_50_schemas 源数据格式现在想知道 all_50_schemas_me.json 里面的格式是怎么样的因为直接用原始数据不行的作者转换过一次如果你知道麻烦告诉我一下谢谢

bojone commented 5 years ago

https://github.com/bojone/kg-2019/blob/master/data_trans.py 通过这个脚本转换原始数据的。

bert关系抽取本身是作为之前dgcnn那篇的后续，可能你没看之前那篇，所以不知道来龙去脉。

chenbaicheng commented 5 years ago

@bojone 万分感谢这几天都在思考这个问题

bojone / bert_in_keras

不好意思 作者 能不能问一下数据的格式是怎么样的 #3

不好意思作者能不能问一下数据的格式是怎么样的 #3