biolab / text-semantics

The package with scripts for semantic analyser project
MIT License
4 stars 5 forks source link

Izroček 2.4: vektorska predstavitev izrazov, karte izrazov #32

Closed BlazZupan closed 3 years ago

BlazZupan commented 3 years ago

Izroček 2.4: knjižnica in primeri uporabe metod za vektorsko predstavitev izrazov in izris kart izrazov.

PrimozGodec commented 3 years ago

V 03_04_vector_representation_of_words.ipynb pridobimo besedila 100 predlogov vladi, jih preprocesiramo in iz njih izluščimo besede. Besede predstavimo z vektorji s pomočjo vložitve imenovane fastText in jih prikažemo v karti izrazov. Tiste besede, ki so podobne, so v karti blizu skupaj. V karti z barvami označimo skupine podobnih izrazov. Da se prepričamo o podobnosti izrazov v skupinah, izpišemo izraze v eni izmed skupin.

BlazZupan commented 3 years ago

Dela na tem izročku so zaključena.

mihajMJU commented 3 years ago

Kako, da sta tukaj samo dve skupini? Ali so prikazani tudi izrazi dokumentov, ki niso v skupini? Oziroma ali je možno videti tudi izraze dokumentov, ki se niso razvrstili vnobeno skupino? Ali je tudi možno videti, v katerih dokumentih se izraz/izrazi pojavljajo?

ajdapretnar commented 3 years ago

@mihajMJU

Pri tem je seveda vprašanje, ali je to mišljeno za shematski prikaz v skriptah ali je to namenjeno kasnejši implementaciji v uporabniškem vmesniku?