pachecotaina / turnover_br

0 stars 0 forks source link

About CBOs #1

Open pachecotaina opened 10 months ago

pachecotaina commented 10 months ago

Paula wrote:

Revisando as suas notas, fiquei com duas dúvidas:

  1. Qual é a CBO q usamos?
  2. Qual é a porcentagem de contratos com CBOs q existem só no setor público?
pachecotaina commented 10 months ago

Como um CBO descreve a ocupação da pessoa, ele pode existir tanto no setor público como no setor privado. De fato, nossa estratégia de matching requer que o CBO exista tanto no setor público quanto no setor privado.

No projeto identificamos o setor público a partir da natureza jurídica. No código 2_matching_public_private_v6.R você vai ver os códigos utilizados nessa classificação e o que cada um deles significa (aqui).

Na descrição dos códigos você pode ver que os trê níveis de governo estão misturados: há códigos para o governo federal, o governo estadual e o governo municipal. Também definimos um vetor com os códigos que são apenas do setor público federal (aqui).

Com base nesses dois vetores criamos as variáveis public e federal (aqui).

Alguns CBOs só podem existir no setor público (aqui). Aqui é uma decisão "teórica" de classificar essas ocupações como sendo apenas do setor público. Como você pode ver no código, decidimos excluir as observações que possuem esse CBO mas são classificadas como sendo do setor privado. Isso porque não sabemos a fonte do erro: pode ser no código CBO ou no código da Natureza Jurídica. Eu salvei uma planilha com esses dados (aqui), mas está no meu computador pessoal em Barcelona - eu não trouxe para Paris.

Essa decisão de excluir as observações com erro leva a uma perda de dados pequena (aqui), não chega a 0.2%. Talvez isso responda ao seu ponto 2

Assim, fazemos o matching entre trabalhadores do setor público e privado com a base "limpa", ou seja, já sem esses erros.

No decorrer do matching eu também faço um controle dos CBOs que foram classificados como público e que não tiveram matching (aqui). Aqui é algo empírico: os dados mostram que alguns CBOs não têm contrapartida no setor privado. Para esses, buscamos as últimas ocupações das pessoas no setor privado nos três anos anteriores (aqui) - essa busca se baseia no PIS. Talvez para o seu ponto 2 você queira juntar a informação do parágrafo acima com essa daqui.

Nessa busca por PIS, há pessoas que não tiveram uma posição no setor privado nos três anos anteriores. (aqui). Para elas, vamos olhar quem teve uma posição nos anos anteriores, tirar a média por CBO, e imputar essa média na base (aqui).

Assim, ao final do processo temos três conjunto de matching:

  1. Match direto: CBO aparece tanto no setor público quanto no setor privado.
  2. Match indireto: CBO só aparece no setor público e a pessoa (PIS) teve uma ocupação no setor privado nos três anos anteriores. Fazemos o match do CBO atual (apenas no setor público) com o CBO anterior da pessoa (no setor privado).
  3. Match indireto médio: para a pessoa que não teve ocupação no setor privado nos últimos 3 anos, pegamos o CBO dela a média do salário que tiramos dos matches de do grupo do match indireto (2).

Não sei se sanei todas as suas dúvidas, e no momento estou sem acesso as bases para verificar ou te madar arquivos. Como são bases sensíveis eu não tenho elas na nuvem.