Denna issue är ju inte färdig – i alla fall inte så som Johan och jag tänkts oss den! Men jag ser att jag inte heller var helt tydlig när jag skrev issuen från början.
Det vi också vill få ut liknar det vi gjorde med klustringen av ordtrender i SOU-materialet. Men här vill vi istället klustra vilka enskilda collocates-ord som har liknande frekvens över tid.
Alltså vore det lämpligt att implementera en hierarkisk klustringsmodell på det collocates som genereras av modellen. Om nyckelordet är "information" ska vi kunna följa hur enskilda collocates till nyckelordet (information-livsmedel, information-problem, information-barn) klustras samman och inte hur collocates-par till nyckelordet (livsmedel-kött, problem-möjlighet, barn-förälder) klustras samman.
Denna issue är ju inte färdig – i alla fall inte så som Johan och jag tänkts oss den! Men jag ser att jag inte heller var helt tydlig när jag skrev issuen från början.
Det vi också vill få ut liknar det vi gjorde med klustringen av ordtrender i SOU-materialet. Men här vill vi istället klustra vilka enskilda collocates-ord som har liknande frekvens över tid.
Alltså vore det lämpligt att implementera en hierarkisk klustringsmodell på det collocates som genereras av modellen. Om nyckelordet är "information" ska vi kunna följa hur enskilda collocates till nyckelordet (information-livsmedel, information-problem, information-barn) klustras samman och inte hur collocates-par till nyckelordet (livsmedel-kött, problem-möjlighet, barn-förälder) klustras samman.
_Originally posted by @fredrik1984 in https://github.com/welfare-state-analytics/welfare_state_analytics/issues/83#issuecomment-728170890_