Esta classe tem o objetivo de realizar tarefas comuns de limpeza de dados em um DataFrame do Pandas. Ela inclui métodos para remover linhas duplicadas e lidar com valores nulos, oferecendo flexibilidade ao escolher como tratar os valores nulos, como remover linhas com valores nulos, preencher com um valor específico ou preencher com a média das colunas.
Métodos principais:
remove_duplicates(): Remove linhas duplicadas do DataFrame.
handle_missing_values(method='drop', columns=None): Lida com valores nulos no DataFrame, permitindo escolher entre 'drop' (remover), 'fill' (preencher com um valor específico) ou 'mean' (preencher com a média das colunas).
clean_data(): Realiza uma série de operações de limpeza de dados padrão, incluindo a remoção de duplicatas e o preenchimento de valores nulos com a média das colunas.
get_cleaned_dataframe(): Retorna o DataFrame limpo após a aplicação das operações de limpeza.
Esta classe tem o objetivo de realizar tarefas comuns de limpeza de dados em um DataFrame do Pandas. Ela inclui métodos para remover linhas duplicadas e lidar com valores nulos, oferecendo flexibilidade ao escolher como tratar os valores nulos, como remover linhas com valores nulos, preencher com um valor específico ou preencher com a média das colunas.
Métodos principais:
remove_duplicates()
: Remove linhas duplicadas do DataFrame.handle_missing_values(method='drop', columns=None)
: Lida com valores nulos no DataFrame, permitindo escolher entre 'drop' (remover), 'fill' (preencher com um valor específico) ou 'mean' (preencher com a média das colunas).clean_data()
: Realiza uma série de operações de limpeza de dados padrão, incluindo a remoção de duplicatas e o preenchimento de valores nulos com a média das colunas.get_cleaned_dataframe()
: Retorna o DataFrame limpo após a aplicação das operações de limpeza.