Closed chervonij closed 5 years ago
у меня здесь до 10К было FS - 1, BS - 5. а потом каждые 5К эпох постепенно опускал до текущих. на 20К включил pixel loss.
когда у тебя был открыт чат, заметил что у людей были проблемы скорее всего из-за стиля. учитывая, что мне нужно где-то 50-60К эпох, то решил что пусть учит стиль понемногу.
не, там крашило от весов. До ввода vg были дефолтные веса. а с random_normal или CA весами получается краш
ок, я понял. попробую, поднять сейчас. пусть выправляется.
что значит выправляется?
я имею в виду - стиль. что бы цвет и освещение лица перенеслось.
вот главный недостаток колаба. можно задать большой размер батча, но на одну итерацию тогда 5 секунд уходит.
ну да медленная у них карточка
а у них там 12 гб? или 24
12гб
с 3-м оптимизером норм, выжирая RAM. Вот в гугле охуеют )
я ведь еще трейнер обновлял фиксил ошибки и сделал чтобы усредненное значение лосс показывало с момента последнего сохранения.
чето мне кажется что со временем если куча народу придет в колаб, то гугл просто забанит наши репо ))
та гуглу, мне кажется, ни холодно ни жарко с этого ) они прекрасно знали, что за платформу они выкатывают. потому и сделали ограничение в 12 часов на рантайм, что бы майнеры это дело не засрали.
да, я видел. но там изменения в Trainer.py, а я сейчас не за своим компом. вечером разберу изменения, допишу в свой Trainer.py и закомичу.
гугл недавно анонсировал свою стриминговую платформу для игр. пообещали что всё будет идти на Ultra настройках графики, в 4К и 60FPS. для это нужно сильно большие ресурсы, чем те что сейчас на колабе. и речь там уже пойдёт на миллионы пользователей.
да ты прав
это я к тому, какие у них вычислительные мощности там. мы им не сильно помешаем ))
ладно, надо кровь из носа понять че за фигня с трейнером по дефолту и как это пофиксить. Попробую заняться.
буду рад любой помощи )
а че ffmpeg извлечение тоже работает?
вообще работает. единственная проблема с ним - тоже не выводится лог. с тех пор, как ffmpeg переехал внутрь скрипта питона.
ffmpeg даже не пробовал трогать, ибо там ошибка с логом некритичная.
вернее, я неправильно выразился. лог выводится, но в процессе не обновляется.
мастер репо ведь грузится норм и одна итерация обучения проходит а потом
Starting. Press "Enter" to stop training and save model.
WARNING:tensorflow:From /usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.cast instead.
[09:02:14][#000001][19.65s][3.0943][1.8054]
: cannot connect to X server
оно полностью вылетает или обучение продолжается, но без обновления лога?
уже всё пофиксил. Осталось только показывать изображение
да, надо походу еще из трейнер треда пересылать и консоль в превью
эмм, сильно сложно сказал, для меня ))
так разве можно было? )
nothing is impossible
хотя чето не фурычит. Проблема в end=/r из отдельного потока. с ней не обновляется ниче, это реально баг колаба. А без end нормально но каждая строка итерации будет новой.
так что пока пусть будет каждая строка итерации - новой. Зато у тебя не будет изменений кода в трейнере )
Попробуй убрать end=/r и вместо него запихать /r в начало строки.
У меня было что-то похожее. И так вроде заработало обновление.
оно у тебя щас работает потому что из главного потока пишется
точнее отсутствуют еще потоки с выводом =)
\r в начале не работает, потому что конец строки уже переносит ее на новую.)
лана я потом отправлю просто баг в колаб, может пофиксят
как нормально вывести изображение из кода? чето нема
ну, так если сделать end="" и потом loss_string = "/r"+loss_string, то не должно быть переноса. логика вроде та же. или потоки руинят это всё?
а ща проверю
как нормально вывести изображение из кода? чето нема
я пробовал через matplot, но оно из внешнего скрипта не хочет нормально работать на вывод.
io.log_info ('\r' + loss_string, end='')
тож не пашет
а сек
да запахало
о, шикарно
и для десктопа такой же подход пашет
хотя для десктопа тогда Saving... переносится в конец
ну, на Saving можно также прилепить \n в начало
сделаю кондишн на колаб
Topic for any questions or bugreports