610265158 / face_landmark

A simple method for face alignment based on wingloss and mutitask learning :)
Apache License 2.0
251 stars 80 forks source link

训练问题 #44

Closed jianghongsun closed 4 years ago

jianghongsun commented 4 years ago

模型保存时存在tensorflow.python.framework.errors_impl.NotFoundError: Failed to create a directory: ./model/epoch_0_val_loss307.512268\variables; No such file or directory

实际上有model文件夹? 麻烦大佬,有空解答下 谢谢

610265158 commented 4 years ago

你是在什么环境下跑的呢, 可以修改一下保存的路径

jianghongsun commented 4 years ago

win10 环境下 tensorlow-gpu 2.0 这个问题解决了 把路径修改为 config.MODEL.model_path = '.\model\' 可以了 但我又遇到一个问题: 1 .将enable_function 设置为True 时: Epoch: 2, Train Loss: nan, Test Loss: nan Time consume: 9.55

  1. 当 enable_function=false时 train_total_loss / num_train_batches, ZeroDivisionError: float division by zero 这个该如何调整呢?麻烦你,有空时解答下? 谢谢
jianghongsun commented 4 years ago

已经运行成功,谢谢

BrownOfSummer commented 4 years ago

@jianghongsun 请问你是怎么解决ZeroDivisionError问题的呢?

monk-gyai commented 3 years ago

已经运行成功,谢谢

大佬 可以问一下你是怎么解决ZeroDivisionError问题的么 我也遇到了同样的问题 @jianghongsun

610265158 commented 3 years ago

ZeroDivisionError, 应该是数据集小了,

可以直接使用pytorch 的分支来做,tensorflow 不好用

monk-gyai commented 3 years ago

我知道问题了 是tensorpack的版本不对 换成0.9.9就好了 是读数据的问题,我已经能跑通了 感谢

在 2021-07-26 16:47:25,"Lz" @.***> 写道:

ZeroDivisionError, 应该是数据集小了,

可以直接使用pytorch 的分支来做,tensorflow 不好用

— You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.