zaqwes8811 / vocabulary-cards-pub

Deployed on GAE
http://arched-glow-381.appspot.com/
Other
0 stars 0 forks source link

[CLOSED] Сделать модель генератор неравномерного распределения #114

Closed zaqwes8811 closed 10 years ago

zaqwes8811 commented 10 years ago

Issue by zaqwes8811 from Wednesday Jul 10, 2013 at 07:56 GMT Originally opened as https://github.com/zaqwes8811/smart-vocabulary-cards/issues/13


zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 07:57 GMT


сперва питоновскую модельку

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 13:07 GMT


можно смасшатбировать равномерное, а потом преобразовать

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 16:20 GMT


еще с квантованием проблемы

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Wednesday Jul 10, 2013 at 16:44 GMT


Пока делать только модель. Ее нужно хорошо тестировать.

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 14:52 GMT


Сделал, но производительность кластеризатора пока максимальна у линейного поиска. Возможно дело в том, что это не совсем поиск и поэтому, для использования двоичных поисковых алгоритмов вынуждает создавать запакованные данные, а распаковка оказалось на занимает много времени (Python) - 2/3, хотя и без этого много. Рекурсивная версия совсем плохо вышла.

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 14:55 GMT


на 100000 элементах разрыв почти 6 раз с итеративной версией - время полсекунды. Размер словаря BEC - 4000 слов распределения будут того уже. Еще Java версия будет реализована - что увеличит скорость. Оставляю линейный алгоритм.

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 15:36 GMT


Я не правильно проверял масштабируемость! Нужно число точек, а не число опытов. Может быть итеративный и вытянет!

zaqwes8811 commented 10 years ago

Comment by zaqwes8811 from Thursday Jul 11, 2013 at 15:48 GMT


нет! самый быстрый рекурсивный. Если запаковать в тапл будет еще быстрее