Open martinyoo opened 7 years ago
오늘 송태응 강사 강의 시 알게된 Event 조사 요청 입니다.
assignee, branch 는 저장소별 분석에 포함하여 진행하며, 'rebase'는 브랜치의 기준이 되는 base를 다시 잡아주는 것으로 주요 이벤트로는 고려하지 않습니다.
'온라인 상호작용 주요 이벤트 구분 및 확인'은 1) 깃허브 저장소별 네트워크 관계로 측정할 이벤트 확인, 2)기존 연구들의 검토를 통하여 협력에 미치는 주요 변수들의 식별을 함께 진행하려 합니다.
관련하여 의견 주시면 진행하는 과정에 참고하도록 하겠습니다.
assignee, branch 는 저장소별 분석에 포함하여 진행하고, rebase는 고려하지 않아도 되겠습니다. 의견에 동의합니다.
Event 종류
Github에는 총 37개의 Event 종류가 있는데, Google Bigquery에서 쿼리문을 통해 확인해본 결과, 오직 14개의 Event만이 발생합니다.
이외의 이벤트들은 webhook이라는 별도의 서비스를 사용해야 얻을 수 있거나, 더이상 사용되지 않거나, github 서비스 측면에서만 trigger되는 이벤트라 저희가 얻을 수 없는 데이터들입니다.
Event 종류에 대한 정의와 내포하고 있는 정보에 대해서는 Github Developer 페이지를 통해 확인했습니다. Github EventType Link
그리고, 다음은 각 Event에 대한 정리입니다.
이 Event들 중 분석 데이터를 선정하여 DB에 추가할 것인데, 이를 정하는데에 있어서는 아직 탐구과정에 있어 설계검수 때 검토하겠습니다.
먼저 분석하느라 수고했습니다.
오늘 회의에서 SPRI쪽과 함께 논의를 하겠지만, 제 생각으로는 bigquery에서 접근가능한 14개 이벤트면, 협업의 행태, 커뮤니케이션 행태, 참여자의 commitement 등을 보는데 충분할 것 같습니다.
기술적으로 문제가 없다면 14개 이벤트를 모두에 대한 DB를 구성하고, 이 중에 네트워크 분석에 사용할 event를 선별하면 어떨까 싶습니다.
혹시 14개 이벤트에 대한 DB 구축이 어렵더라도, 기본적으로는 repository 시그니처 테이블(repository별로 한 개의 레코드를 가지는 테이블)에는 위의 14개 이벤트들 각각의 평균, 표준편차, 최대값, 최소값, 중간값(이것은 가능하면)이 포함되어야 할 것 같습니다.