[CLOSED] Сделать модель генератор неравномерного распределения

zaqwes8811 / vocabulary-cards-pub

Deployed on GAE

http://arched-glow-381.appspot.com/

Other

0 stars 0 forks source link

[CLOSED] Сделать модель генератор неравномерного распределения #114

Closed zaqwes8811 closed 10 years ago

zaqwes8811 commented 10 years ago

Issue by zaqwes8811 from Wednesday Jul 10, 2013 at 07:56 GMT Originally opened as https://github.com/zaqwes8811/smart-vocabulary-cards/issues/13

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 07:57 GMT

сперва питоновскую модельку

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 13:07 GMT

можно смасшатбировать равномерное, а потом преобразовать

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 16:20 GMT

еще с квантованием проблемы

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 16:44 GMT

Пока делать только модель. Ее нужно хорошо тестировать.

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 14:52 GMT

Сделал, но производительность кластеризатора пока максимальна у линейного поиска. Возможно дело в том, что это не совсем поиск и поэтому, для использования двоичных поисковых алгоритмов вынуждает создавать запакованные данные, а распаковка оказалось на занимает много времени (Python) - 2/3, хотя и без этого много. Рекурсивная версия совсем плохо вышла.

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 14:55 GMT

на 100000 элементах разрыв почти 6 раз с итеративной версией - время полсекунды. Размер словаря BEC - 4000 слов распределения будут того уже. Еще Java версия будет реализована - что увеличит скорость. Оставляю линейный алгоритм.

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 15:36 GMT

Я не правильно проверял масштабируемость! Нужно число точек, а не число опытов. Может быть итеративный и вытянет!

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 15:48 GMT

нет! самый быстрый рекурсивный. Если запаковать в тапл будет еще быстрее