welfare-state-analytics / welfare_state_analytics

Welfare State Analytics
5 stars 0 forks source link

Concept co-occurrence clustering #118

Open roger-mahler opened 3 years ago

roger-mahler commented 3 years ago

Denna issue är ju inte färdig – i alla fall inte så som Johan och jag tänkts oss den! Men jag ser att jag inte heller var helt tydlig när jag skrev issuen från början.

Det vi också vill få ut liknar det vi gjorde med klustringen av ordtrender i SOU-materialet. Men här vill vi istället klustra vilka enskilda collocates-ord som har liknande frekvens över tid.

Alltså vore det lämpligt att implementera en hierarkisk klustringsmodell på det collocates som genereras av modellen. Om nyckelordet är "information" ska vi kunna följa hur enskilda collocates till nyckelordet (information-livsmedel, information-problem, information-barn) klustras samman och inte hur collocates-par till nyckelordet (livsmedel-kött, problem-möjlighet, barn-förälder) klustras samman.

_Originally posted by @fredrik1984 in https://github.com/welfare-state-analytics/welfare_state_analytics/issues/83#issuecomment-728170890_

roger-mahler commented 3 years ago

@fredrik1984 @Stubbendorff

roger-mahler commented 3 years ago

Planeras in i December Milestone.