ria-com / nomeroff-net

Nomeroff Net. Automatic numberplate recognition system.
GNU General Public License v3.0
459 stars 159 forks source link

Распознавание номеров для Молдовы #222

Closed ciolak closed 1 year ago

ciolak commented 2 years ago

Не могли бы добавить в функционал распознавание молдавских номеров. Сейчас процент определения низкий, где то на уровне 50%. Долго пробовал своими усилиями дотренировать модель, не получилось (новичок в машинном обучении). Собрал 1000 изображений с номерами ссылка

alexeysi commented 2 years ago

А много еще на улице машин с номерами образца 1992 года? Или больше с 2015? Есть в принципе минимальная база 20 тыс 1992го и 10тыс 2015го. 1000 изображений конечно недостаточно.

ApelSYN commented 2 years ago

Спасибо за датасет. Мы можем натренировать модель, но нам нужны для этого данные. 1000 это хорошее начало, но этого мало, для хорошего качества модели нужно где-то 10 000 или больше. Их можно спарсить с других сайтов, собрать самому или купить (например на этом сайте https://platesmania.com/md/). Я не знаю какие сейчас цены, раньше был минимальный заказ 50$ за 50 000 фото. Потом этот датасет надо будет "обработать" и извлечь сами номера (это тоже можем сделать мы), после этого можно будет добавлять модель md в nomeroff.net . Мы заинтересованы в поддержке новых стран но на сбор датасета времени нет, тут Вы можете внести свой вклад данными.

ciolak commented 2 years ago

А много еще на улице машин с номерами образца 1992 года? Или больше с 2015? Есть в принципе минимальная база 20 тыс 1992го и 10тыс 2015го. 1000 изображений конечно недостаточно.

Нет не много, но встречаются. В основном с 2015 года. И в Молдове есть еще так скажем переходные с 2011 - 2015. Wiki

1000 это хорошее начало, но этого мало, для хорошего качества модели нужно где-то 10 000 или больше.

Если я правильно понял, то мы можем разделить процесс на 2 части.

  1. Вы заносите MD в nomeroff.net (используя отправленные 1000 фото) а я в это время собираю полный датасет для финальной тренировки.
  2. Прогоняется повторно на базе 10к фото?
ApelSYN commented 2 years ago

Если я правильно понял, то мы можем разделить процесс на 2 части.

Вы заносите MD в nomeroff.net (используя отправленные 1000 фото) а я в это время собираю полный датасет для финальной тренировки. Прогоняется повторно на базе 10к фото?

Мы не можем добавить некачественную модель в репозиторий. План такой: вы даете датасет 10 000+ и мы тренируем и добавляем md c хорошим качеством, вы присылаете проблемные фото мы фиксим проблемы. Сами "вырезанные" из датасета номера выкладываем в общий доступ, как это сделано для других стран. Сам датасет с фото авто не выкладываем. В датасете в описании указываем Вас как автора этого набора данных. "Квадратные/многолинейные номера" нету смысла присылать, они распознаются однолинейной моделью и распознаються хуже. Это плата за простоту и за скорость.

ciolak commented 2 years ago

Понял, спасибо. Подготовлю нужный датасет и вернусь.

ciolak commented 2 years ago

Собрал датасет в 12500 фотографий ссылка, должно хватить для тренировки

ApelSYN commented 2 years ago

Собрал датасет в 12500 фотографий ссылка, должно хватить для тренировки

Ок, приступили к работе. Возможно, понадобиться еще небольшая помощь в вычитке части датасета уже "вырезаных" номеров.

ciolak commented 2 years ago

Возможно, понадобиться еще небольшая помощь в вычитке части датасета уже "вырезаных" номеров.

Хорошо, скажете что надо и сделаю.

ApelSYN commented 2 years ago

Хорошо, скажете что надо и сделаю.

Датасет сформирован и "грубо" размечен, нужно вычитать через админку. У нас на вычетку ресурсов нет, требуется помощь. Напишите мне на почту oleg.cherniy@ria.com я дам доступ а админку для вычетки.

ciolak commented 2 years ago

Вчера написал Вам на почту, моя почта ciolak@mail.ru