Closed ciolak closed 1 year ago
А много еще на улице машин с номерами образца 1992 года? Или больше с 2015? Есть в принципе минимальная база 20 тыс 1992го и 10тыс 2015го. 1000 изображений конечно недостаточно.
Спасибо за датасет. Мы можем натренировать модель, но нам нужны для этого данные. 1000 это хорошее начало, но этого мало, для хорошего качества модели нужно где-то 10 000 или больше. Их можно спарсить с других сайтов, собрать самому или купить (например на этом сайте https://platesmania.com/md/). Я не знаю какие сейчас цены, раньше был минимальный заказ 50$ за 50 000 фото. Потом этот датасет надо будет "обработать" и извлечь сами номера (это тоже можем сделать мы), после этого можно будет добавлять модель md в nomeroff.net . Мы заинтересованы в поддержке новых стран но на сбор датасета времени нет, тут Вы можете внести свой вклад данными.
А много еще на улице машин с номерами образца 1992 года? Или больше с 2015? Есть в принципе минимальная база 20 тыс 1992го и 10тыс 2015го. 1000 изображений конечно недостаточно.
Нет не много, но встречаются. В основном с 2015 года. И в Молдове есть еще так скажем переходные с 2011 - 2015. Wiki
1000 это хорошее начало, но этого мало, для хорошего качества модели нужно где-то 10 000 или больше.
Если я правильно понял, то мы можем разделить процесс на 2 части.
Если я правильно понял, то мы можем разделить процесс на 2 части.
Вы заносите MD в nomeroff.net (используя отправленные 1000 фото) а я в это время собираю полный датасет для финальной тренировки. Прогоняется повторно на базе 10к фото?
Мы не можем добавить некачественную модель в репозиторий. План такой: вы даете датасет 10 000+ и мы тренируем и добавляем md c хорошим качеством, вы присылаете проблемные фото мы фиксим проблемы. Сами "вырезанные" из датасета номера выкладываем в общий доступ, как это сделано для других стран. Сам датасет с фото авто не выкладываем. В датасете в описании указываем Вас как автора этого набора данных. "Квадратные/многолинейные номера" нету смысла присылать, они распознаются однолинейной моделью и распознаються хуже. Это плата за простоту и за скорость.
Понял, спасибо. Подготовлю нужный датасет и вернусь.
Собрал датасет в 12500 фотографий ссылка, должно хватить для тренировки
Собрал датасет в 12500 фотографий ссылка, должно хватить для тренировки
Ок, приступили к работе. Возможно, понадобиться еще небольшая помощь в вычитке части датасета уже "вырезаных" номеров.
Возможно, понадобиться еще небольшая помощь в вычитке части датасета уже "вырезаных" номеров.
Хорошо, скажете что надо и сделаю.
Хорошо, скажете что надо и сделаю.
Датасет сформирован и "грубо" размечен, нужно вычитать через админку. У нас на вычетку ресурсов нет, требуется помощь. Напишите мне на почту oleg.cherniy@ria.com я дам доступ а админку для вычетки.
Вчера написал Вам на почту, моя почта ciolak@mail.ru
Не могли бы добавить в функционал распознавание молдавских номеров. Сейчас процент определения низкий, где то на уровне 50%. Долго пробовал своими усилиями дотренировать модель, не получилось (новичок в машинном обучении). Собрал 1000 изображений с номерами ссылка