AlexGonRo / Instance-Selection-Algorithms-Spark

GNU General Public License v3.0
1 stars 1 forks source link

Erroronea repartición aleatoria de instancias de DIS #42

Closed AlexGonRo closed 7 years ago

AlexGonRo commented 8 years ago

Originally reported by: Alejandro González Rogel (Bitbucket: agr00095, GitHub: Unknown)


Se ha encontrado un error en la repartición aleatoria de instancias del algoritmo de selección de instancias Democratic Instance Selection, en la fase de votación.

Este error ocasionaba que varias instancias utilizasen el mismo "estado" del particionador para decidir su próxima partición.

Normalmente (y esto incluye el TFG), cuando se ha hecho uso del algoritmo utilizábamos un número de particiones muy bajo con respecto al número de instancias que tenía cada partición (en los resultados del anexo teníamos 5-10-20 particiones de 1000 instancias cada una). En este caso, el problema es apenas invisible y apenas afecta a la repartición o al resultado final.

SIN EMBARGO, a medida que el número de particiones se acerca al número de instancias de cada partición este problema se va agrabando, hasta el punto de generarse particiones vacías que impiden la ejecución del algoritmo.

Se requiere solucionar esto.


AlexGonRo commented 8 years ago

Original comment by Alejandro González Rogel (Bitbucket: agr00095, GitHub: Unknown):


Sobre el commit 7c38819:

Solución aplicada, ahora la partición de los datos se realiza correctamente.