Problema com Rotulagem de Setores e Sugestão de Solução Automatizada

Descrição do Problema

Atualmente, os setores são rotulados com uma letra inicial maiúscula (A, B e C), que aparece como os primeiros caracteres no rótulo dos setores.

A intenção da rotulagem inicial foi criada em um esforço para organizar os setores de forma crescente, linha a linha, e na tentativa de identificar os principais setores:
- Identificar setores Alfa (iniciando com "A", como AAProdução), Beta (iniciando com "B", como BIndustria), e ExtraLocal (iniciando com "C").
Em discussão com Ellen Claudine, surgiu a sugestão de granular o rótulo C em C e D, para distinguir setores Nacionais (marcados como C) dos setores Internacionais (marcados como D).

A sugestão de Ellen é interessante em termos conceituais: a diferença entre o kg de açaí vendido para São Paulo do açaí vendido para os EUA é importante, e não pode ser resumido em apenas C. Contudo, em termos operacionais sinto que para implementar isso há uma forma mais simples do que editar à mão os dados dos setores nas tabelas.

Criar uma nova tbextensa.xls com novas colunas de índices setores
A forma mais eficaz para resolver a questão da rotulagem é automatizar a criação de um índice de setores com o código:: df['IndiceSetor'] = df['ColunaOriginal'].str[:2]
Dessa forma, teríamos a capacidade tanto de organizar um índice de setores separadamente simultaneamente em que há possibilidade de granular o setor C em C e D.

Qual é o propósito do segundo caractere na organização crescente/decrescente? Ele é necessário apenas para essa finalidade? Se for o caso, talvez ele possa ser excluído para simplificar ainda mais a estrutura de rotulagem.