CRIPAC-DIG / TextING

[ACL 2020] Tensorflow implementation for "Every Document Owns Its Structure: Inductive Text Classification via Graph Neural Networks"
180 stars 57 forks source link

关于20ng数据集疑问 #9

Closed xhjcxxl closed 4 years ago

xhjcxxl commented 4 years ago

你好,我是用此模型跑20ng数据集的时候,提示内存不足,不知道你们是怎么处理的

Magicat128 commented 4 years ago

你好 @xhjcxxl ,

可能是因为个别文档长度较大的原因,导致padding后整体开销变大。可以考虑对长文档进行截断之类的操作,见build_graph.py第32-33行。

xhjcxxl commented 4 years ago

请问,论文中所有的测试结果都是经过截断操作的吗?(我自己测试的时候,不截断也可以跑起来)

xhjcxxl commented 4 years ago

谢谢,20ng通过截断后,能够跑起来了

Magicat128 commented 4 years ago

论文中的结果都是未截断的。

xhjcxxl commented 4 years ago

明白了,谢谢