Closed luisgasco closed 1 year ago
[x] Documentar las funciones métodos y clases del repositorio(https://peps.python.org/pep-0008/) Ejemplo:
def some_function(argument1):
"""Summary or Description of the Function
Parameters:
argument1 (int): Description of arg1
Returns:
int:Returning value
"""
return argument1
print(some_function.__doc__)
[x] Modificar extract_terms de la clase TermExtractor. El input method siempre tiene que estar en un a lista (y libranos del if-else).
[x] Incorporar language a word_tokenize(phrase.text, language=self.language) en los extractors.
[x] Modificar funciones extract_term, de cada extractor para que devuelvan también los scores, si no devuelve scores, que devuelva Nones.
[x] Modificar las functiones extract_terms_with_span para que devuelva estructura de datos con información de término, span_ini,span_end y socre. Por ejemplo: [(term, span_ini, span_end , score), (term, span_ini, span_end , score)]
[x] Generar clase para estructura de datos de tipo Keyword. Crearla en módulo utils, en clase llamada data_structures.py. Por ejemplo: class Keyword: def init(self, text, method, score): self.text = text self.method = method self.score = score self.spans = []
[x] Guardar los datos en lista de keywords dentro de extract_terms de la clase TermExtractor (en atributo self.keywords). Por ejemplo: self.keywords = [Keyword(i[0], i[1], i[2], [i[3],i[4]]) for i in all_terms]
[x] Hacer que el rmv_overlaps afecte a cada uno de los metodos de extracción por separado en lugar de a todos a la vez y luego dar una opción para que se pueda usar en todos a la vez posteriormente
[x] Notebook de prueba rendimiento: