RUCAIBox / RecBole

A unified, comprehensive and efficient recommendation library
https://recbole.io/
MIT License
3.35k stars 604 forks source link

Linux下调用 get_flops函数出现 Segmentation fault (core dumped)错误 #1551

Open yuguoxinls opened 1 year ago

yuguoxinls commented 1 year ago

描述这个 bug 我在使用quick_start模块中的KGIN模型时,输出完模型信息相关日志后,直接 Segmentation fault (core dumped),然后程序直接自动退出。但是我再Windows 10的CPU环境下,没有出现这个问题,程序能够正常运行

如何复现 复现这个 bug 的步骤:

  1. 您引入的额外 yaml 文件

    Environment config

    gpu_id: "3"

    dataset config : Knowledge-based Recommendation

    USER_ID_FIELD: user_id ITEM_ID_FIELD: item_id HEAD_ENTITY_ID_FIELD: head_id TAIL_ENTITY_ID_FIELD: tail_id RELATION_ID_FIELD: relation_id ENTITY_ID_FIELD: entity_id load_col: inter: [user_id, item_id] kg: [head_id, relation_id, tail_id] link: [item_id, entity_id]

    model config

    kg_embedding_size: 64

    Training and evaluation config

    learning_rate: 0.0001 sim_regularity: 0.00001 eval_args: split: {'RS': [0.8, 0.1, 0.1]} group_by: user order: RO mode: full metrics: ['Recall', 'MRR', 'NDCG', 'Hit', 'Precision'] topk: 20 valid_metric: MRR@20

  2. 您的代码 from recbole.quick_start import run_recbole run_recbole(model='KGIN', dataset='ml-1m', config_file_list=['test.yaml'])
  3. 命令行命令 python run.py

预期 程序能够正常运行

屏幕截图 添加屏幕截图以帮助解释您的问题。(可选)

链接 添加能够复现 bug 的代码链接,如 Colab 或者其他在线 Jupyter 平台。(可选)

实验环境(请补全下列信息):

xingchen192 commented 1 year ago

同求,我也是window没问题,linux遇到这个报错

leoleojie commented 1 year ago

@xingchen192 @yuguoxinls 您们好!感谢对伯乐的关注! 很抱歉,我们在测试时没有复现出这个错误。请问在运行其他模型时会出现这种错误吗?或者是否是使用的linux环境对内存存在限制?或者在注释get_flops函数后是否依然存在问题?