medialab / toflit18

TOFLIT18 datascape's sources.
http://toflit18.medialab.sciences-po.fr
14 stars 2 forks source link

Exportation csv de la vue «Product Term Network» #147

Closed gdaudin closed 4 years ago

gdaudin commented 6 years ago

L'exportation donne la liste des nœuds liés à d'autres nœuds avec le nombre de flux entre eux. Il faudrait la changer dans trois directions :  1) donner soit le nombre de flux, soit la valeur des flux, selon l'option choisie pour la viz pour l'utilisateur. 2) donner les information spécifique à chaque nœud (par exemple, le nombre/valeur des flux totaux, même ceux où le terme est seul.) 3) donner des informations sur les nœuds isolés, qui sont sur la viz mais pas dans l'export.

paulgirard commented 6 years ago

Je me demande si ce ne serait pas mieux ou aussi souhaitable de faire un export des noms de produits et non des termes (noeuds du réseaux). Pour chaque noms de produits on peut alors ajouter les métadonnées nombre et valeurs des fluxs. Ce serait sans doute plus clair pour les utilisateurs ?

gdaudin commented 6 years ago

Oui, c'est sans doute ce que les utilisateurs cherchent, mais :

paulgirard commented 6 years ago

On peut faire les deux

paulgirard commented 4 years ago

Je pense comme toi que le format de la viz est plutôt ce qui est attendu là. On opte donc pour l'export du format réseau soit une liste des liens pondérés entre termes ?

gdaudin commented 4 years ago

Ok, donc on reste sur ce qui permet de refaire la viz. Du coup, il faut une liste de liens pondérés entre termes, mais aussi une liste de terme (y compris les isolés) avec les informations spécifiques aux termes. Bref, tout ce qui est envoyé à l’application qui dessine la viz, non ?

paulgirard commented 4 years ago

Oui à ce jour le navigateur ne reçoit que le réseau de termes et non les flux ayant servis à fabriquer le réseau. Donc on peut facilement exporter la liste des termes et les liens entre eux pondérés. Auquel cas cela veut dire deux exports : CSV des termes, CSV des liens entre termes

gdaudin commented 4 years ago

Est-ce qu’on peut / doit viser un format d’exportation du type pajek-net ? C’est du texte et c’est suffisamment structuré pour que l’utilisateur puisse le mettre facilement dans son logiciel d’analyse / représentation de réseau de son choix ? https://gephi.org/users/supported-graph-formats/pajek-net-format/

En fait, je ne sais pas s’il y a un format standard pour les réseaux ? C’est cela qu’il faudrait utiliser (si c’est du texte).

Il y a des choses là  : https://gephi.org/users/supported-graph-formats/, mais je n’y connais rien...

paulgirard commented 4 years ago

oui on peut faire un format réseau mais ce sera moins pratique pour les gens qui veulent faire des stats. Auquel cas gexf. tu préfère que ce soit facile à ouvrir dans gephi ou facile à ouvrir dans un tableur ?

gdaudin commented 4 years ago

Ah euh... J’hésite. Baba ou tiramisu ? Bon, égoïstement je dis tableur alors. Après une vérification rapide, il me semble que les formats DL Ucinet ou Pajek ne peuvent pas faire double emploi si j’en crois https://gephi.org/users/supported-graph-formats/, ?

paulgirard commented 4 years ago

Pour le moment on a fait au plus vite en branchant ce qui existait pour location network.

gdaudin commented 4 years ago

Il faudrait aussi une liste de termes.

paulgirard commented 4 years ago

Dans ce cas le mieux est de faire deux export distinct un pour les noeuds/termes, l'autre pour les liens.

gdaudin commented 4 years ago

Oui, c’est peut-être le plus simple.

gdaudin commented 4 years ago

Et tant que nous sommes sur le sujet : il faudrait aussi exporter la couleur / community Louvain dans l’export des nœuds.

paulgirard commented 4 years ago

La couleur ou l'information de communauté ?

gdaudin commented 4 years ago

L’information

On 5 Oct 2020, at 9:55, Paul Girard wrote:

La couleur ou l'information de communauté ?

-- You are receiving this because you authored the thread. Reply to this email directly or view it on GitHub: https://github.com/medialab/toflit18/issues/147#issuecomment-703466848

gdaudin commented 4 years ago

C’est cool ! Par contre, il me semble qu’on exporte deux fois la même colonne : la "size" et la "flow". En enlever une (ou m’expliquer ?)

gdaudin commented 4 years ago

Ok, pas grave