Concept co-occurrence clustering

roger-mahler commented 3 years ago

Denna issue är ju inte färdig – i alla fall inte så som Johan och jag tänkts oss den! Men jag ser att jag inte heller var helt tydlig när jag skrev issuen från början.

Det vi också vill få ut liknar det vi gjorde med klustringen av ordtrender i SOU-materialet. Men här vill vi istället klustra vilka enskilda collocates-ord som har liknande frekvens över tid.

Alltså vore det lämpligt att implementera en hierarkisk klustringsmodell på det collocates som genereras av modellen. Om nyckelordet är "information" ska vi kunna följa hur enskilda collocates till nyckelordet (information-livsmedel, information-problem, information-barn) klustras samman och inte hur collocates-par till nyckelordet (livsmedel-kött, problem-möjlighet, barn-förälder) klustras samman.

_Originally posted by @fredrik1984 in https://github.com/welfare-state-analytics/welfare_state_analytics/issues/83#issuecomment-728170890_

roger-mahler commented 3 years ago

@fredrik1984 @Stubbendorff

roger-mahler commented 3 years ago

Planeras in i December Milestone.

welfare-state-analytics / welfare_state_analytics

Concept co-occurrence clustering #118