jisungyoon / Structure-of-Science

Science of Science, Collective Intelligence
2 stars 0 forks source link

Result For Abstract #23

Closed jisungyoon closed 5 years ago

jisungyoon commented 5 years ago

일단 abstract를 쓰기 위한 중간 결과를 공유합니다. 금일 오후 2시에 미팅으로 관련된 내용들을 정리하였습니다.

  1. 매칭갯수가 1인 것도 평균 낼 떄 포함
  2. 베타는 1로 고정, 방법론을 이야기할 때에는 포함

cluster_map 1

Similarity Matrix를 보았을 떄 크게 5개의 클러스터가 관측되었습니다.

  1. 영어, 중국어, 스페인어, 한국어, 이탈리아가 포함된 클러스터 (이탈리아는 좀 애매하긴 합니다)
  2. 대부분의 유럽 권들이 포함되어 있는 클러스터
  3. 프랑스와 히브리어 (연결강도가 약합니다)
  4. 아랍어와 페르시아어
  5. 타이어 asdfasdfasdf

그 기반으로 distance matrix ( 1 - similiart matrix) Minimum spanning tree를 그린 결과(similiarty의 Maximum spanning tree)이며 클러스터링 결과와 그렇게 다르지 않습니다. 좀 더 정보를 제공하기 위해, A-B라는 링크가 있을 때 A에서의 링크의 중요도 vs B에서의 링크 중요도를 비교해서 상대적으로 더 중요한 쪽에서 아닌 쪽으로 방향성을 주었습니다. 링크 중요도는 Similiarty의 크기로 rank를 매겨서 사용하였습니다. (만약 같다면 두 방향 모두)

mds

이 그림은 distance matrix ( 1 - similiart matrix)를 이차원에 투영시키는 방법론인 MSD(https://en.wikipedia.org/wiki/Multidimensional_scaling) 을 이용해 본 결과이며 이 결과도 그렇게 다르지 않습니다.

중간결과이기 때문에 클러스터의 대략적 의미와 내용을 정리해 초록을 작성중이며, 이후에는 여러가지 factor들을 넣어서 regression을 돌려보려고 합니다.

혹시 figure에 대한 코멘트가 있으시면 달아주시면 감사하겠습니다.

wsjung77 commented 5 years ago

figure2_panel

이게 현재 윤혜진 교수님과 진행하고 계신 신화 논문의 main figure 중 하나인데요. 클러스터 & 시간별 퍼져나가는 걸 보여주는 겁니다. 위키는 현재 자료만 있는 거니 퍼져나가는 건 어려울 거고, language family, geographic 등과 연계한 그림 그릴 방법을 찾아보면...

<그림 다른 곳으로 나가면 안 됩니다> :)

bluekura commented 5 years ago

figure2_panel

이게 현재 윤혜진 교수님과 진행하고 계신 신화 논문의 main figure 중 하나인데요. 클러스터 & 시간별 퍼져나가는 걸 보여주는 겁니다. 위키는 현재 자료만 있는 거니 퍼져나가는 건 어려울 거고, language family, geographic 등과 연계한 그림 그릴 방법을 찾아보면...

몇년 전에 이거 윤혜진교수님이 이거 너무 재밌는 결과 나왔다고 즐거워 하시던 기억이 나는군요...

wsjung77 commented 5 years ago

figure2_panel 이게 현재 윤혜진 교수님과 진행하고 계신 신화 논문의 main figure 중 하나인데요. 클러스터 & 시간별 퍼져나가는 걸 보여주는 겁니다. 위키는 현재 자료만 있는 거니 퍼져나가는 건 어려울 거고, language family, geographic 등과 연계한 그림 그릴 방법을 찾아보면...

몇년 전에 이거 윤혜진교수님이 이거 너무 재밌는 결과 나왔다고 즐거워 하시던 기억이 나는군요...

거기서 더 발전을 많이 했죠. 재미가 더해져서... 2월 중 submit 예정입니다.

jisungyoon commented 5 years ago

main_figure.pdf 초록에 쓰일 메인 피규어입니다. 앞에서 논의 한 내용은 따로 내용을 정리해서 이슈 등록 하겠습니다!

jisungyoon commented 5 years ago

Monthly view 였던 걸로 기억합니다. 정정합니다 View per hour입니다. 아마 같을 거지만요..

이 표는 abstract에선 legend와 비슷한 역할인 거 아닌가요? 그럼 abc 순이거나... 뭐 그런 순서가 보는 사람이 찾기 쉽지 않을까요?

figure a에서의 순서대로 정렬 하는 것이 좋을 것 같습니다. 그러면 클러스터 별로 정렬되기도 할테니까요

jisungyoon commented 5 years ago

main_figure.pdf 순서 수정했고 스웨덴 위키를 뺸결과라는걸 까먹었내요 ㅜㅜ 표에서 제거 하였습니다.

bluekura commented 5 years ago

(b) 의 글씨가 잘 안보이는 느낌이 있군요. 굵게 바꾸시거나 폰트를 바꿔보시는건...?

wsjung77 commented 5 years ago

(b)는 어차피 동그라미 크기의 의미는 없지 않나요? 동그라미 크기를 키우고, 거기에 맞춰서 폰트를 키워도요.

jisungyoon commented 5 years ago

main_figure.pdf 수정 완료하였습니다!

bluekura commented 5 years ago

여전히 잘 안보인다는 느낌이... 폰트를 볼드로 바꿔보시겠어요?

jisungyoon commented 5 years ago

Bold로 해보고 싶은데 python igraph에서 관련 옵션을 못찾아서요 ㅜㅜ R에는 있는것 같은데

jisungyoon commented 5 years ago

아니면 networkx로 한번 그려보겠습니다

jisungyoon commented 5 years ago

아니면 networkx로 한번 그려보겠습니다

시도는 해보았으나... 레이아웃 때문에 그림이 영...... igraph로 그린 그림이 훨신 나은 듯합니다

bluekura commented 5 years ago

음.. 뭐 일단 넘어가죠.

wsjung77 commented 5 years ago

논문으로 내기 전까지 그림 스킬을 많이 익히시길... :)

wsjung77 commented 5 years ago

별 상관없을 거 같지만... 혹시 이리 발전할지도 모르니...

https://github.com/zalandoresearch/flair

jisungyoon commented 5 years ago

Abstract가 완성되어 공유드립니다! 확인이 완료되시면 제출하도록 하겠습니다. The_interrelationship_of_knowledge_structure_across_language_groups__in_communal_data_set.pdf

jisungyoon commented 5 years ago

위에서 디스커션 했던 내용은 정리해서 이슈로 따로 등록 해두겠습니다. 그리고 지금 쓰지 않는 이슈 같은 경우에는 정리해서 닫도록하고, 이 이슈도 초록 제출 한 뒤 정리해서 닫도록 하겠습니다.

wsjung77 commented 5 years ago

초록은 일단 진행하시죠.

jisungyoon commented 5 years ago

2/10까지 기한이 연장되었네요. 딱히 수정 할 내용이 없으면 그대로 두겠습니다!

jisungyoon commented 5 years ago

제출 하였음으로 이 이슈는 닫도록 하겠습니다!