cheunx2 / team3_wanted_onboarding_2nd

1 stars 8 forks source link

Week1_ 성장률에 대한 의견 #30

Open cheunx2 opened 3 years ago

cheunx2 commented 3 years ago

성장률에 대한 의견 정리하여 남겨 주시면 감사하겠습니다 :)

cheunx2 commented 3 years ago

필터링 한 기업 중에 월별 직원수가 항상 증가한 기업은 없었습니다. 가장 첫 데이터와 가장 마지막 데이터의 상승률을 구하여 상위 20개 기업과 같이 자르는 것도 방법도 좋아보입니다.

연 매출은 항상 증가한 기업으로 필터링 하는 것이 좋다고 생각합니다.

Leo-hw commented 3 years ago

저는 필터링 한 결과 21개의 기업 중, 연매출액과 월별 직원수를 그래프로 그려서 같은 모양인, 추세가 같은 기업들을 추렸습니다. 그 결과 5개 정도의 기업이 나왔습니다.

21개의 기업 대상으로, 상관관계 히트맵 그려본 결과 연매출액과 월별직원수, 월별 연금보험료에 매우강한 상관관계를 확인할 수 있었습니다. 그리고 추가적으로 1인당 매출액과 월별 직원수의 상관관계를 확인 했습니다. 이부분으로 접근해도 괜찮을 거 같습니다.

필터링 한 21개 기업 대상 상관관계 히트맵

image

Castlegus commented 3 years ago

이 전 이슈에다가 작성한 내용 축약인데요.

  1. 유니콘 기업은 역성장 하지 않는다는 가정으로 연매출 기준 한 번이라도 마이너스 성장한 회사, 즉 전년도(기록연도) 대비 매출액 증감률이 0% 이하인 회사 1187개 제거하여 457개 회사 남았습니다.

  2. 연월 데이터가 아예 없는 경우가 많아서... '년도'로 그룹핑하여 월별 직원수의 평균으로 '연평균 직원수'를 만들고 연평균 직원수가 전년대비 감소했다면 성장이 정체되었을 것이라 보아 제거했더니 215개 기업이 남았습니다.

이렇게 할 생각인데 그 관건인 '어느정도'로 해야 하는가를 모르겠네요

JeonghyunKo commented 3 years ago

** 성장률

  1. 연매출

    • 항상 증가한 기업으로 필터링하는 것에 동의합니다.
    • 유니콘 기업은 급성장을 하는 경우가 많고, 또 매출 감소를 고려하기에는 연매출 값은 몇개 되지 않는 상황이기 때문입니다.
  2. 직원수

    • 처음에는 단순히 평균 증가율을 생각해봤는데, 기업 규모가 작은 경우에 평균 증가율이 굉장히 높아져서 이 방법은 폐기했습니다
    • 항상 증가한 기업으로 보려고 했는데 팀장님께서 이미 하셨군요... 기각하겠습니다

** 진행방향

Leejaein19 commented 3 years ago

저는 현재 유니콘 기업을 기반 삼아 살펴보았습니다. 기본적인 필터링은 마지막 연도 매출액이 500억 이상 입니다,

  1. 현재 유니콘 기업 중 절반 이상이 매출액이 2배 이상 급증하는 경우를 보았습니다. 따라서 본 자료에서도 3개 연도에서 최소 1회 100% 이상의 성장률을 기록한 기업을 포함하는 것이 좋다고 생각합니다.
  2. 현재 유니콘 기업중 '직방' 같은 경우는 낮은 매출액이었음에도 큰 성장이 없던 기업이었습니다. 그렇다면 여기에 기준을 둬서 마지막 연도를 포함 3개 연도에서 500억 이상을 기록했던 안정적인 기업도 포함하는 것이 좋다고 생각합니다.
cheunx2 commented 3 years ago

연매출 0프로 이상 상승 연직원수 하락시 제외 1인 평균 연매출로 sort, 상위 10위 기업 선정하여 데이터 분석

JeonghyunKo commented 3 years ago

어제 성현님이 의견 주셨던 대로, 연 평균 직원 수를 산출한 다음 전년 대비 평균 직원 수가 증가하는 기업만 필터링해봤는데 477곳이네요...!

set1 = set(comlist)
set2 = set(unicorn[unicorn["연매출액"] >= 24900000]["회사ID"].unique())
set3 = set(unicorn.groupby('회사ID').filter(lambda x: len(x)>=36)["회사ID"].unique())
print("기준 1 충족 : ", len(set1))
print("기준 2 충족 : ", len(set2))
print("기준 3 충족 : ", len(set3))
print("세 기준을 모두 충족하는 기업은 몇 군데?", len(set1 & set2 & set3))
기준 1 충족 :  477
기준 2 충족 :  433
기준 3 충족 :  1127
세 기준을 모두 충족하는 기업은 몇 군데? 90

참고가 되실까 하여 남겨둡니다

Leo-hw commented 3 years ago

저도 어제 성현님 의견에 추가로 제가 말했던 1인당 매출액 상승률까지 추가 적용해본 결과 59곳의 기업이 남네요.

매출액 기준으론 제외하지 않았습니다.

image

Castlegus commented 3 years ago

저는 앞서 말씀드린 남은 215개 기업에서

  1. 최근 연매출액 200억원 이상 (2020기준 연매출 최저 유니콘 기업이 249억이라, 보수적으로 200억으로 잡았습니다.)
  2. 최근 연평균 직원 수 100명 이상

으로 필터링했더니 22개 기업이 남았고, 연월별 직원 수 변화를 시각화하여 살펴보니

  1. 연월별 직원 수의 급격한 감소(들쭉날쭉)를 보인 기업 2군데
  2. 연월별 직원 수가 최근 데이터 기준 감소 추세인 기업 4군데

를 제외하여 16개 기업이 남았습니다.

  1. 여기서 더 줄여야한다고 생각하여, 한 번 이상의 급격한 성장과 직원 수 증가를 이룬 기업을 찾아봤습니다. 5-1) 유니콘 기업 최소 5개 이상을 발굴하는 것이 미션이기 때문에, 적절한 조합을 이리저리 찾아본 결과 '급격한 성장 기준'은 한 번이라도 매출 전년 대비 30% 증가, 한 번이라도 연 평균 직원 수 10% 증가로 보았습니다. 5-2) 유니콘기업은 직원 수 증가보다 매출의 성장이 더욱 가파를 것이라 가정했기 때문입니다. (꼭 매출이 늘어난다고 인력을 증가시킬 필요는 없음)

이렇게 7개 기업이 남았고, 연속 3개년 데이터가 아니여서 증가율에서 데이터 왜곡이 발생할 수 있을것이라 판단한 1개의 기업을 제외하여 최종 6개 기업을 선정하였습니다.

지금도 적절한 방안을 찾는 중입니다.

참고용/기록용으로 적었습니다.