Closed wenfeixiang1991 closed 5 years ago
@liu946 这个项目现在不更新了吗?以后是否还打算更新呢?
@wenfeixiang1991 开源版本不在进行更新。我们的最新进展会上线讯飞开放平台,欢迎大家使用 https://www.xfyun.cn/services/lexicalAnalysis 。
奥奥,好的,那这个 pyltp 中的这个内存问题是否能劳烦解决一下呢?现在做不了稍大一点的数据实验分析,很头痛
@liu946 我在想如果能解决这个问题,即使不再更新,也还是可以用的,那就太感谢啦! :)
在提问之前,请确认以下几点:
问题类型
1、内存错误 2、[dynet] random seed: 254078971 中的 seed 为什么每次都随机?难道不应该固定吗?
出错场景
情况1、在连续应用 segmentor, sostagger, sarser, sementicRoleLabeller 对句子(小于500字)进行 srl 时,内存会由开始的 4G 多到 6G 多,再到 10G 左右稳定,再持续一段时间到 突然 13G 然后被 kill 掉。 情况2、一开始运行内存就很快升高到 13、16G 左右,导致还没等对一个句子 srl 成功就已经被 kill 掉了。 情况3、同情况1一样,但最后并不是被 kill 掉,而是报 CPU memory allocation failed n =11173625856 align=32 Exception CPU memory allocation failed 然后卡住,而不是被 kill 掉,此时仍然占用内存,大概 13G 左右吧。
情况2、情况3 偶然发生,情况1一直发生,虽然开始能运行,能对对 3万多个个句子(小于500字)持续 srl,但被 kill 掉只是时间问题。
已经参考过问题 #141,怀疑是 内存泄漏问题,还请解决这个问题。
代码片段
其中 def get_event_triples_srl(sentence):
如何复现这一错误
运行环境
Linux python 3.6 pyltp==0.2.1 模型 ltp_data_v3.4.0
期望结果
其他
Please ensure your issue adheres to the following guidelines:
What is affected by this bug?
When does this occur?
Where on the code does it happen?
How do we replicate the issue?
Your environment information
Expected behavior (i.e. solution)
Other Comments