Open SergeKZ opened 2 years ago
Вот тут пример: https://github.com/ria-com/nomeroff-net/blob/master/examples/ju/dataset_tools/auto_number_grab.ipynb
Там предполагается что есть некий csv-файл, в котором указаны имена файлов без расширения и что текст на номере, приблизительно так:
photoId,npText
250031471orig,NEBV043
Но если этой информации нет, можно универсальной моделью попытаться задетектить, тогда этот файл не указываем, вот пример формирования датасета для Молдовы:
auto_number_grab(root_dir, res_dir, image_loader="turbo",
replace_template={'moderation': {'isModerated': 1, 'moderatedBy': 'RIA.com'}, 'state_id': 2},
#csv_dataset_path=csv_dataset_path, # or None if you don`t have moderated data
prisets={
"eu": {
"for_regions": ["eu"],
"model_path": "latest"
},
},
default_label = "eu",
quality_profile=[5, 2, 0])
там грамматическая ошибка prisets (правильно presets), но пока что это не пофиксили, поэтому пишем "prisets"
Спасибо буду пробовать, наверно пример с csv подойдет ибо фото вида 777AAA01.jpg придется просто листинг кинуть в csv
Спасибо буду пробовать, наверно пример с csv подойдет ибо фото вида 777AAA01.jpg придется просто листинг кинуть в csv
Вот тут пример: https://github.com/ria-com/nomeroff-net/blob/master/examples/ju/dataset_tools/auto_number_grab.ipynb
Там предполагается что есть некий csv-файл, в котором указаны имена файлов без расширения и что текст на номере, приблизительно так:
photoId,npText 250031471orig,NEBV043
Но если этой информации нет, можно универсальной моделью попытаться задетектить, тогда этот файл не указываем, вот пример формирования датасета для Молдовы:
auto_number_grab(root_dir, res_dir, image_loader="turbo", replace_template={'moderation': {'isModerated': 1, 'moderatedBy': 'RIA.com'}, 'state_id': 2}, #csv_dataset_path=csv_dataset_path, # or None if you don`t have moderated data prisets={ "eu": { "for_regions": ["eu"], "model_path": "latest" }, }, default_label = "eu", quality_profile=[5, 2, 0])
там грамматическая ошибка prisets (правильно presets), но пока что это не пофиксили, поэтому пишем "prisets"
всё четко вырезало подскажите куда дальше смотреть, а именно запускать для дообучения на CPU и модерирования процесса.
Еще столкнулся с такой ошибкой, думаю както надо указать юзать чисто СPU ?
3.5 M Trainable params
0 Non-trainable params
3.5 M Total params
13.862 Total estimated model params size (MB)
Epoch 0: 0%| | 0/2 [00:00<?, ?it/s]terminate called after throwing an instance of 'c10::HIPError'
what(): HIP error: hipErrorNoDevice
HIP kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing HIP_LAUNCH_BLOCKING=1.
Exception raised from deviceCount at /pytorch/aten/src/ATen/hip/impl/HIPGuardImplMasqueradingAsCUDA.h:102 (most recent call first):
frame #0: c10::Error::Error(c10::SourceLocation, std::string) + 0x42 (0x7f1db5346212 in /usr/local/lib/python3.7/site-packages/torch/lib/libc10.so)
frame #1:
Хочу дообучить номера подскажите какой скрипт отвечает за выдерание номеров из картинок? На хабре нашел инструкцию но она устарела =(