capyvara / brazil-civil-registry-data

Raw scrapings of ARPEN https://transparencia.registrocivil.org.br/
39 stars 10 forks source link

Add skin color #6

Open capyvara opened 3 years ago

capyvara commented 3 years ago

Agora tem as opções: (Indiferente) ou Amarela, Branca, Ignorada, Indigena, Parda, Preta

Isso multiplicaria as permutações em 6x, inviável para os detailed, precisamos achar alguma opção.

Podemos agregar algumas? (ex: Parda e Preta) Quão importante é esse dado? Idéias?

beatrizjardim commented 3 years ago

Ja vi estudos que categorizar em branco/não branco

Em seg, 13 de jul de 2020 14:13, Marcelo Oliveira notifications@github.com escreveu:

Agora tem as opções: (Indiferente) ou Amarela, Branca, Ignorada, Indigena, Parda, Preta

Isso multiplicaria as opções em 6x, inviável para os detailed, precisamos achar alguma opção.

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/capyvara/brazil-civil-registry-data/issues/6, or unsubscribe https://github.com/notifications/unsubscribe-auth/AJXDTZCW65KFAHGHJQFFJZ3R3M6EFANCNFSM4OYV7WLA .

oranzani commented 3 years ago

Concordo com a opção que a Beatriz sugeriu. Outra é agregar parda+preta e Indígena+Amarela, ficando 3 (+ Ignorada). Branco/não-branco já usei e me pediram para não usar durante revisão de artigo, porque não se aplicaria tanto ao Brasil, como nos US, europa, etc. Mas acho que dependendo da feasibility do scrapy, seria uma boa solução também.

thomas-fujiwara commented 3 years ago

Acho importante deixar a ignorada sempre separada, a gente quer saber pra qtas pessoa esta “missing” a info.

Eu juntaria preta+parda e branca+amarela, socioeconômicamente os brancos e asiaticos sao “parecidos” no Brasil

beatrizjardim commented 3 years ago

Concordo em incluir a categoria "ignorada". Minha dúvida: como ficariam os indígenas nessa classificação?

Em seg., 13 de jul. de 2020 às 15:04, thomas-fujiwara < notifications@github.com> escreveu:

Acho importante deixar a ignorada sempre separada, a gente quer saber pra qtas pessoa esta “missing” a info.

Eu juntaria preta+parda e branca+amarela, socioeconômicamente os brancos e asiaticos sao “parecidos” no Brasil

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/capyvara/brazil-civil-registry-data/issues/6#issuecomment-657708133, or unsubscribe https://github.com/notifications/unsubscribe-auth/AJXDTZDTEM7JAI54CSLEFGLR3NECJANCNFSM4OYV7WLA .

thomas-fujiwara commented 3 years ago

Eh, se nao puder ter 4 (ignorada, indígena, branca+amarela, preta+parda), poderia colocar indigena com preta+parda (minorias mais vulneráveis socioeconomicamente?) , nao eh o ideal mas se precisar ter so 3 categorias...

capyvara commented 3 years ago

Essas 4 parece ok para os não detailed.

Para os detailed, precisa de um corte mais forte, vocês acham muito ruim fazer por semana? o dado diário tem relevância forte assim?

thomas-fujiwara commented 3 years ago

Eu nao tenho usado o detailed - entao por mim uma vez por semana seria OK. Mas obviamente nao posso falar pelos outros.

oranzani commented 3 years ago

Acho que os dados diários faria diferença mais só para mim, Marcelo. Fora modelar, o que me pegava sempre em usar semana, como comecei, era dar um valor muito alto ao atraso, porque o atraso em 7 dias fica mais exacerbado. Mas se for só eu, não tem problema, obviamente. Todo caso falo contigo. Um detail só por idade, sem place e sem sexo, ajuda?

capyvara commented 3 years ago

A place faria diferença (mas não muita), o sexo não pq iria tirar idade junto (não tenho como fazer uma query sexo indiferente).

O problema é que preciso de um corte pesado, já estava ruim antes e colocar pele vai fazer tudo x4 basicamente.

E se eu fizer algo do tipo, semanal mas diário só para as últimas semanas (ou último mês) ?

beatrizjardim commented 3 years ago

Oi pessoal! Eu tenho analisado por mês. 😬

Eu já tinha feito um trabalho bem inicial e estou pensando em dar uma sequência a ele, também analisando por mês.

Em sáb, 18 de jul de 2020 19:32, Marcelo Oliveira notifications@github.com escreveu:

A place faria diferença (mas não muita), o sexo não pq iria tirar idade junto (não tenho como fazer uma query sexo indiferente).

O problema é que preciso de um corte pesado, já estava ruim antes e colocar pele vai fazer tudo x4 basicamente.

E se eu fizer algo do tipo, semanal mas diário só para as últimas semanas (ou último mês) ?

— You are receiving this because you commented. Reply to this email directly, view it on GitHub https://github.com/capyvara/brazil-civil-registry-data/issues/6#issuecomment-660551902, or unsubscribe https://github.com/notifications/unsubscribe-auth/AJXDTZHBHAVACV4QCF3AMTLR4IPIRANCNFSM4OYV7WLA .