Encore-final-team-project / Dynamic-Indices-cluster

Bigdata Clustering with Blanace Sheet and Stocks
Eclipse Public License 2.0
2 stars 1 forks source link

Dataset 진행사항과 이슈사항 #5

Open seanshlee opened 1 year ago

seanshlee commented 1 year ago

< 진행상황 >

1. 부도를 판단하는 기준으로 '상장폐지' 여부 채택. : 상장 폐지 현황 검색 사이트( https://kind.krx.co.kr/investwarn/delcompany.do?method=searchDelCompanyMain) 에서 2022, 2023 상장폐지 기업리스트를 전처리하여 공유폴더에 저장. 공유폴더 링크 : https://drive.google.com/drive/folders/1XPLbOKjBnJ9LAckE5o7xiywoeO75fveL?usp=sharing

2. Dart API로 상장기업 재무제표 데이터(분기,반기,사업(1년)보고서 중 사업보고서 채택) 확보 -> 2022, 2023년 재무제표 데이터를 ipynb 파일과 함께 공유폴더에 저장. (이 데이터에서 1번의 상장폐지 기업들을 체크하여 부도기업 여부 변수를 추가한 후, 재무비율들을 사용하여 부도를 예측하는 모델링을 하려고 했으나 아래와 같은 이슈가 발생.)

< 이슈사항 >

  1. 상장폐지된 기업의 경우, Dart 홈페이지에서 조회하면 사업보고서 조회가 가능하지만, API를 통해 사업보고서(재무제표) 정보를 불러올 수 없어서 부도한 기업의 부도 이전 재무제표 데이터 확보 실패.

  2. 이자보상비율(영업이익/이자비용)이 1미만인 경우 한계기업, 1이상인 경우 정상기업으로 분류하는 선행연구를 참고 (레퍼런스 정리 시트 링크 : https://docs.google.com/spreadsheets/d/1gvaE2NebfGsGI53_rsn4XVRp8CHPu-zGpbfTPKj8tgw/edit?usp=sharing) 해서 부도여부 대신 한계기업 여부를 레이블로 사용해보고자 했지만, 2022/2023 재무제표 데이터에 이자비용 항목 누락.

< 해결방안 >

  1. https://github.com/josw123/dart-fss-example/blob/master/README.rst 이 링크를 참고해보면, 현금흐름표 데이터 확보 시 '이자의 지급 (interest paid)' 항목을 사용할 수 있게 되는데, 제가 시도해봤을 때 "import dart_fss as dart" 여기서부터 계속 import가 되지 않아서 시도해보지 못했습니다. 다른 분들이 링크에 나온대로 한 번 해보셔서 성공한다면, 이자보상비율(영업이익/이자비용)을 구해서 한계기업 여부를 레이블로 사용할 수 있을 것 같습니다.
datajcthemax commented 1 year ago

고생 하셨습니다. 저희 미국주식 데이터로 하는거로 이해하고 있는데 한국주식도 하는건가요?

seanshlee commented 1 year ago

미국하고 한국 둘 다 하기로 해서 저는 한국 쪽, 준영님이 미국 쪽 진행하고 있습니다!