Problema com Rotulagem de Setores e Sugestão de Solução Automatizada
Descrição do Problema
Atualmente, os setores são rotulados com uma letra inicial maiúscula (A, B e C), que aparece como os primeiros caracteres no rótulo dos setores.
Contexto
A intenção da rotulagem inicial foi criada em um esforço para organizar os setores de forma crescente, linha a linha, e na tentativa de identificar os principais setores:
Identificar setores Alfa (iniciando com "A", como AAProdução), Beta (iniciando com "B", como BIndustria), e ExtraLocal (iniciando com "C").
Em discussão com Ellen Claudine, surgiu a sugestão de granular o rótulo C em C e D, para distinguir setores Nacionais (marcados como C) dos setores Internacionais (marcados como D).
Justificativa da sugesão da Ellen
A sugestão de Ellen é interessante em termos conceituais: a diferença entre o kg de açaí vendido para São Paulo do açaí vendido para os EUA é importante, e não pode ser resumido em apenas C. Contudo, em termos operacionais sinto que para implementar isso há uma forma mais simples do que editar à mão os dados dos setores nas tabelas.
Sugestão de Solução
Criar uma nova tbextensa.xls com novas colunas de índices setores
A forma mais eficaz para resolver a questão da rotulagem é automatizar a criação de um índice de setores com o código::
df['IndiceSetor'] = df['ColunaOriginal'].str[:2]
Dessa forma, teríamos a capacidade tanto de organizar um índice de setores separadamente simultaneamente em que há possibilidade de granular o setor C em C e D.
Pergunta em aberto
Qual é o propósito do segundo caractere na organização crescente/decrescente? Ele é necessário apenas para essa finalidade? Se for o caso, talvez ele possa ser excluído para simplificar ainda mais a estrutura de rotulagem.
Problema com Rotulagem de Setores e Sugestão de Solução Automatizada
Descrição do Problema
Contexto
AAProdução
), Beta (iniciando com "B", comoBIndustria
), e ExtraLocal (iniciando com "C").Justificativa da sugesão da Ellen
Sugestão de Solução
tbextensa.xls
com novas colunas de índices setoresdf['IndiceSetor'] = df['ColunaOriginal'].str[:2]
Pergunta em aberto