D2CampusFest / 3rd

27 stars 4 forks source link

[ward] 수집된 데이터 분석 #21

Closed egaoneko closed 4 years ago

egaoneko commented 8 years ago

수집된 데이터를 분석하는 부분에 대해 고민하고 있습니다.

수집된 데이터를 분석하여 의미있는 내용들을 뽑아서 보여주고 싶은데, 어떤 방식으로 접근해야할지 잘 모르겠습니다.

현재 제가 생각하고 있는 것은 저장되어 있는 데이터를 형태소를 분석하여, 좋아요 수와 댓글 수로 점수를 매기어 해당 그룹에서 인기있는 키워드를 찾아 보여주고, 이 데이터를 바탕으로 새로 작성되는 게시글을 보여주는 순서를 변경해 보여주는 방식인데 어떨지 모르겠네요.

egaoneko commented 8 years ago

@Rumo-Arf 페이스북에서 가지고온 데이터 중에 점수를 매길만한 의미있는 부분을 고민해봤는데 좋아요랑 댓글밖에 떠오르지 않더라고요. 공유같은 경우는 큰 의미가 없어보이더라고요. 저기에 Python 그룹이면 Python과 관련된 키워드는 점수를 더 주거나 이러고 싶은데.. 이건 해당 그룹의 관련된 키워드를 어떻게 생성해야 할지도 감이 안잡히네요.

egaoneko commented 8 years ago

@Rumo-Arf 역시 어렵네요. ㅠㅠ;; 저희도 이 부분에 대해서는 고민중에 있어요.

egaoneko commented 8 years ago

@Rumo-Arf 좋은 자료 감사드립니다. 팀원과 함께 보고 의논해보겠습니다~

jafffy commented 8 years ago

저는 Konlpy(http://konlpy.org/en/v0.4.4/)를 이용해서 비슷한 word counter 를 만들어 본 경험이 있습니다. 참고하시면 쉽게 하실 수 있을 것 같네요.

또한, 평가 식을 만드는 부분은 원래 어려운 부분으로 알고 있어서 나중에 밋업 주제로 Data science 하시는 분 모셔서 조언을 다같이 듣는 것도 좋을 것 같다는 생각이 드네요.

egaoneko commented 8 years ago

@jafffy 답변 감사드립니다. Konlpy도 고려해보겠습니다. 가능하다면 밋업 주제로 조언을 받으면 좋을 것 같네요.