Final demo review / TODO

yhamoudi commented 9 years ago

All you reviews / TODO about the final demo.

it's strictly forbidden to make whole sentences into the demo, except for the demo questions :o
Machine Learning – Reformulation : no "formal" algorithm. If you want to present an algo, you run it on an example (even if some parts of the algo don't occur on your example)
Who is an actor in Titanic and Inception? -> are you sure it's a correct sentence in english (in google i don't see any question starting like this)
How much animations in the slides?

Ezibenroc commented 9 years ago

Who is an actor in Titanic and Inception? -> are you sure it's a correct sentence in english (in google i don't see any question starting like this)

I think that the intersection of actors is a good one. But I don't find a good English sentence to ask this (generally, when you use the word "and", you mean an union... For instance, if I ask "Who are the president of France and the United States?", I expect the answer "Hollande and Obama", not the empty set.). So, any good idea is welcome...

Tpt commented 9 years ago

On devrait peut-être se mettre d'accord sur l'assignation des parties lors de la présentation

Voici un premier brouillon (que je mettrais à afin de garder une vue globale) 1 Introduction (Marc ?) 2 Demo + UI (Thomas) 3 Datamodel (Marc) 4 Architecture (Valentin) 5 NLP intro (Tom) 6 NLP classical (Yassine) 8 NLP ML reformulation (Raphaël) 9 NLP ML standalone (Quentin) 10 Wikidata (Thomas) 11 CAS (Marc) 12 Spell-checker (Tom) 13 vs Wolfram fight (Tom) 14 conclusion (Thomas ?)

cf Google sheet donnée en privé

Je suis prêt à faire l'intro ou la conclusion

robocop commented 9 years ago

Idem. Il n’y aura pas grand chose sur NLP ML standalone (soit j’explique en détail et ça prend 10 minutes, soit je n’explique rien et ça prend 1min)

Le 14 déc. 2014 à 20:00, Thomas Tanon notifications@github.com a écrit :

On devrait peut-être se mettre d'accord sur l'assignation des parties lors de la présentation

Voici un premier brouillon (que je mettrais à afin de garder une vue globale) 1 Introduction ? 2 Demo + UI (Thomas) 3 Datamodel (Marc) 4 Architecture (Valentin ?) 5 NLP intro (Yassine ou Tom) 6 NLP classical (Yassine ou Tom) 8 NLP ML reformulation (Raphaël) 9 NLP ML standalone (Quentin) 10 Wikidata (Thomas) 11 CAS (Marc) 12 vs Wolfram fight (Yassine ou Tom) 13 conclusion ?

Je suis prêt à faire l'intro ou la conclusion

— Reply to this email directly or view it on GitHub.

Ezibenroc commented 9 years ago

Je pensais laisser la partie Question Parsing à Yassine, qui a fait plus de trucs que moi.

Ezibenroc commented 9 years ago

Rappel @ProjetPP/ensl-team : il faut que la demo soit complète ce soir, afin de pouvoir répéter demain matin. Il faudra également une seconde répétition (mercredi après la complexité ?).

progval commented 9 years ago

Thomas et moi avons un exam d’anglais après la complexité, donc non.

Mais on peut répéter demain matin, éventuellement demain à la place du SIESTE, et jeudi avant la démo.

On 15/12/2014 08:51, Tom Cornebize wrote:

Rappel @ProjetPP/ensl-team : il faut que la demo soit complète ce soir, afin de pouvoir répéter demain matin. Il faudra également une seconde répétition (mercredi après la complexité ?).

Reply to this email directly or view it on GitHub: https://github.com/ProjetPP/Papers/issues/21#issuecomment-66959519

Ezibenroc commented 9 years ago

Je suggère d'utiliser ça pour la présentation: http://davvil.github.io/pdfpc/ (ou tout autre logiciel équivalent)

Sous linux: aptitude install pdf-presenter-console Puis pdfpc pppDemo.pdf

Tpt commented 9 years ago

Ou, plus simple, on utilise Keynote directement ;-)

marc-chevalier commented 9 years ago

Tpt : +1

Ezibenroc commented 9 years ago

Ça n'est pas plus simple.

marc-chevalier commented 9 years ago

Pense à moi par exemple qui n'ai pas et ne veut pas installer LaTeX sous Linux. Et j'ai d'excellentes raisons.

Ezibenroc commented 9 years ago

T'as regardé ce que c'était que ce logiciel ? Ça permet simplement d'afficher un pdf, il suffit que ça soit installé sur le PC utilisé pour la présentation...

marc-chevalier commented 9 years ago

Et l’intérêt d’alourdir les slides alors que c'est contre ce qui est fait depuis le début ? Car oui, ça alourdit très nettement pour l’œil de l'auditoire.

marc-chevalier commented 9 years ago

Ou alors, le point de vue de Pinkie : oui, ça sert à rien quoi.

Ezibenroc commented 9 years ago

T'as toujours pas compris ce que c'était. Pour l'auditoire, ça ne change rien. C'est uniquement pour le présentateur que ça change : ça affiche le prochain slides et le timer.

marc-chevalier commented 9 years ago

Mieux vaut simplement connaitre ses slides. En plus, avec un logiciel qu'on ne connait pas, c'est un coup à ne pas réussir à mettre en plein écran en temps polynomial.

Ezibenroc commented 9 years ago

En plus, avec un logiciel qu'on ne connait pas, c'est un coup à ne pas réussir à mettre en plein écran en temps polynomial.

D'où l'intérêt des répétitions :)

marc-chevalier commented 9 years ago

Ou plutôt d'utiliser ce qu'on connait quand ça suffit bien. J'ai fait tout le colloquium et toute ma soutenance de stage sans me retourner vers les slides (sauf quand je devais pointer un point en particulier) et sans regarder mon écran.

En ayant ce genre de chose, ça donne envie de regarder l'écran de sa machine : mauvais ! Juste connaitre ce qu'on va présenter permet de ne pas quitter l'auditoire des yeux, c'est infiniment mieux et on n'est pas tenté de regarder ailleurs.

Ezibenroc commented 9 years ago

Oui, comme on peut aussi compter les secondes dans sa tête pour avoir un timing parfait...

On aura de toute façon l'écran sous les yeux, avec la tentation de le regarder. Autant maximiser les informations qu'il y a dessus. C'est à chacun de faire l'effort de ne pas le regarder trop souvent.

Pour moi, ça serait comme se passer de notes de cours à un examen quand elles sont autorisées, pour éviter de passer trop de temps à les lire. C'est prendre le problème à l'envers...

marc-chevalier commented 9 years ago

Magnifique sophisme.

Avoir plus d'infos => les rendre moins lisibles et passer plus de temps sur l'écran à les lire.

Le problème de les lire, ce n'est pas le temps perdu, c'est qu'on ignore l'auditoire. Lors des notes de cours durant un exam, on s'en fiche bien que tu quittes ta copie des yeux.

Ezibenroc commented 9 years ago

Ça ne dépend pas du logiciel, mais des compétences du présentateur.

Utiliser une visionneuse pdf classique, ça implique d'avoir un chronomètre posé à côté de l'ordinateur, deuxième source de distraction. De plus, connaître ses slides par coeur est vite infaisable lorsqu'il s'agit d'animations (on a vite-fait d'oublier une animation dans une frame). Ce problème est réglé par ce programme.

Tpt commented 9 years ago

Le temps de parole est en moyenne de 3 mn 1/2 par personne. C'est pas dur de connaitre 4-5 slides...

Tpt commented 9 years ago

autre point : 53 slides pour 25mn (sans compter les démos) c'est beaucoup

Ezibenroc commented 9 years ago

autre point : 53 slides pour 25mn (sans compter les démos) c'est beaucoup

+1, mais certains slides sont assez légers.

eddycaron commented 9 years ago

C’est juste pas possible

20-25 slides, cela semble plus raisonnable

Eddy Caron. Mcf HDR ENS Lyon Inria CNRS UCBL ENS Lyon - LIP - Projet Avalon 46 Allee d'Italie, 69364 Lyon Cedex 07, France E-Mail : Eddy.Caron@ens-lyon.fr

[ Tel : 04.72.72.80.04 ][ Web page : http://graal.ens-lyon.fr/~ecaron ]

Le 15 déc. 2014 à 12:28, Tom Cornebize notifications@github.com a écrit :

autre point : 53 slides pour 25mn (sans compter les démos) c'est beaucoup +1, mais certains slides sont assez légers.

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-66981527.

marc-chevalier commented 9 years ago

Slide 2 => Pourquoi ? Image illisible en pratique.

Slide 13 => Inutile car il y a une paire de slides sur le data model.

Grammatical = [15;21], bien trop technique et détaillé. Les gens vont retenir "CoreNLP sort un arbre de dépendance et on fait des fusions en fonction du type de dépendance". On peut en donner encore un peu plus pour leur montrer que vous avez fait des choses compliquées mais pas autant. S'ils en veulent plus, cf rapports ou questions.

Reformulaton = [23;27] Vachement limite en longueur sachant qu'il y a un algo au milieu... Je pense qu'il faut expliquer la fin et, vu le temps que Cerise a passé à tenter de nous expliquer son truc, il faut simplifier le moyen (voire le laisser tomber). Simplifier en "c'est du ML qui travaille avec des vecteurs etc..." suffira pour tous ceux que ça ne passionne pas. Les autres : cf questions ou rapports. Et même, ce n'est pas retenable, ni présentable à l'oral. Cerise y a passé un temps fou et peu peuvent se vanter d'avoir compris. Ici, on a une paire de minutes. Et un truc trop creux se remarquera moins qu'un gros truc brouillon, mal compris et long.

Standalone, on l'attend encore... Dois je me fâcher ?

Wikidata = [31;36] Encore limite et trop détaillé. Une fois qu'on a compris comment étaient faites les entités Wikidata, c'est vachement intuitif. Et ce qui ne l'est pas sont des détails techniques qui ne sont pas forcément pertinents dans cette présentation.

Tpt commented 9 years ago

Pour Wikidata cela va super vite : 60s Wikidata et 60 le fonctionnement (c'est juste une anim en 3 slides) et le dernier on le zape si nécessaire.

Ezibenroc commented 9 years ago

Slide 2 => Pourquoi ? Image illisible en pratique.

Je vais remplacer la liste de noms par un nuage de noms (comme les idées de modules à la fin).

Slide 13 => Inutile car il y a une paire de slides sur le data model.

Ok.

Grammatical = [15;21]

À la limite on peut fusionner la normalisation et les règles de remplacement (ces règles sont plutôt une question d'implem au final, on peut décrire complètement l'algo sans les utiliser). @yhamoudi tu en penses quoi ? À part ça ce n'est pas si technique. On fait juste des opérations basiques sur un arbre, et assez intuitives. Je suis sur qu'on ne dépasse pas de nos 5minutes (et sans perdre l'auditoire).

Reformulaton = [23;27]

Tout remplacer par deux slides. Un premier qui montre ce que fait le module (on montre le triplet en entrée, puis le triplet en sortie). Un second qui dit que l'on fait du machine learning.

Wikidata = [31;36]

Pas d'accord, je trouve les slides très biens.

Datamodel.

Trop long. J'enlèverai l'exemple sur Newton (on a déjà une intersection plus loin, pas la peine de montrer une conjonction). J'enlèverai également l'exemple sur ebola, vu que les quantificateurs ne sont pas encore supportés par les modules QuestionParsing, et que c'est assez intuitif lorsque l'on a compris les opérateurs first et sort.

yhamoudi commented 9 years ago

Slide 13 : ok pour l'enlever mais alors le datamodel doit :

afficher des arbres en 2D. Je le dit encore une fois : si le data model ne fait pas figurer d'arbres en 2D (à chaque fois qu'un arbre sous forme linéaire apparaît) il faut revoir toutes la partie question parsing grammatical (aussi bien dans le rapport que dans la démo) pour mettre des arbres sous forme linéaire (ça sera moche, et je le ferais pas)
dire explicitement ce que le slide 13 évoque, à savoir que certaines formes normales sont correctes du point de vue du datamodel, mais pas souhaitables en pratique (je trouve que ça a plus sa place dans l'intro générale du question parsing que avant ceci dit...)

Grammatical : ok pour raccourcir mais comment ?

Ezibenroc commented 9 years ago

afficher des arbres en 2D. Je le dit encore une fois : si le data model ne fait pas figurer d'arbres en 2D (à chaque fois qu'un arbre sous forme linéaire apparaît) il faut revoir toutes la partie question parsing grammatical (aussi bien dans le rapport que dans la démo) pour mettre des arbres sous forme linéaire (ça sera moche, et je le ferais pas)

+1, faut arrêter le massacre avec les arbres 1D...

Tpt commented 9 years ago

+1 avec Tom sur le data model. Il y a trop d'exemples.

marc-chevalier commented 9 years ago

Ben... Je ne définis pas les nœuds lorsque je les liste et l'intersection est très différente de la conjonction. exists n'a pas à être enlevé parce qu'il n'est pas supporté et il n'est pas du tout intuitif et ça n'a rien à voir avec sort, c'est celui qui nous a donné le plus de mal.

De plus, c'est 10s par exemple (sans la moindre exagération). Et ma version avec 1 slide où il y en a maintenant 3 permet de passer plus vite sur une liste pas franchement passionnante : elle est mieux à lire qu'à dire.

Marc CHEVALIER

Le 15/12/2014 17:11, Tom Cornebize a écrit :

Datamodel.
Trop long. J'enlèverai l'exemple sur Newton (on a déjà une intersection plus loin, pas la peine de montrer une conjonction). J'enlèverai également l'exemple sur ebola, vu que les quantificateurs ne sont pas encore supportés par les modules QuestionParsing, et que c'est assez intuitif lorsque l'on a compris les opérateurs first et sort.

marc-chevalier commented 9 years ago

Ok si tu reformes les arbres de la partie data model.

Marc CHEVALIER

Le 15/12/2014 17:11, Yassine a écrit :

Slide 13 : ok pour l'enlever mais alors le datamodel doit :

afficher des arbres en 2D. Je le dit encore une fois : si le data model ne fait pas figurer d'arbres en 2D (à chaque fois qu'un arbre sous forme linéaire apparaît) il faut revoir toutes la partie question parsing grammatical (aussi bien dans le rapport que dans la démo) pour mettre des arbres sous forme linéaire (ça sera moche, et je le ferais pas)

dire explicitement ce que le slide 13 évoque, à savoir que certaines formes normales sont correctes du point de vue du datamodel, mais pas souhaitables en pratique (je trouve que ça a plus sa place dans l'intro générale du question parsing que avant ceci dit...)

Grammatical : ok pour raccourcir mais comment ?

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-67017970.

Tpt commented 9 years ago

@s-i-newton Ok si cela prend effectivement pas plus de 10s par slides. Car sinon c'est trop.

marc-chevalier commented 9 years ago

Je maintiens que non, car les exemples servent à expliquer. Je ne vais rien dire sur la liste, c'est imbuvable. Mais si les exemples ne couvrent pas les différents types, autant ne pas les introduire. En plus, c'est franchement la partie la plus compréhensible, grâce à des exemples courts et simples.

Marc CHEVALIER

Le 15/12/2014 17:13, Thomas Tanon a écrit :

+1 avec Tom sur le data model. Il y a trop d'exemples.

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-67018227.

yhamoudi commented 9 years ago

À la limite on peut fusionner la normalisation et les règles de remplacement (ces règles sont plutôt une question d'implem au final, on peut décrire complètement l'algo sans les utiliser). @yhamoudi tu en penses quoi ?

bonne idée, je dégage complètement le slide Replacement rules

sinon concernant le datamodel, les slides pourraient être un peu plus sexy :

couleur
plus aérés
faire apparaître progressivement les éléments du datamodel (genre ressources -> triplets -> union/intersection -> first/sort) avec à chaque fois un exemple (en 2D :o). Par exemple, dès que tu évoque le triplet, un triplet s'affiche à droite de l'écran

Ok si tu reformes les arbres de la partie data model.

c'est à dire ?

marc-chevalier commented 9 years ago

Vous avez déjà utilisé des slides ? C'est évident qu'il ne faut pas plus et de toute façon, que dire de plus ? On voit bien tout de suite. Je pourrais même ne rien dire, ce serait immédiatement clair. Le 15/12/2014 17:17, Thomas Tanon a écrit :

@s-i-newton https://github.com/s-i-newton Ok si cela prend effectivement pas plus de 10s par slides. Car sinon c'est trop.

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-67018867.

Marc Chevalier

ENS de Lyon Site Monod M1 Informatique Fondamentale

Tpt commented 9 years ago

Note : ce serait cool d'avoir un slide avec les différents groupe de travail. Pas forcément pour être montré en cours de présentation mais je pense que c'est une question qui risque d'être posée.

marc-chevalier commented 9 years ago

Tu peux les redessiner en 2D, mais pas de façon plus progressive, on perd du temps pour rien. Les gens qu'on a en face n'y connaissent rien mais sont intelligents.

Marc CHEVALIER

Le 15/12/2014 17:17, Yassine a écrit :

À la limite on peut fusionner la normalisation et les règles de
remplacement (ces règles sont plutôt une question d'implem au
final, on peut décrire complètement l'algo sans les utiliser).
@yhamoudi <https://github.com/yhamoudi> tu en penses quoi ?
bonne idée, je dégage complètement le slide |Replacement rules|

sinon concernant le datamodel, les slides pourraient être un peu plus sexy :

couleur

plus aérés

faire apparaître progressivement les éléments du datamodel (genre ressources -> triplets -> union/intersection -> first/sort) avec à chaque fois un exemple (en 2D :o). Par exemple, dès que tu évoque le triplet, un triplet s'affiche à droite de l'écran

Ok si tu reformes les arbres de la partie data model.

c'est à dire ?

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-67019004.

marc-chevalier commented 9 years ago

Exact.

Marc CHEVALIER

Le 15/12/2014 17:19, Thomas Tanon a écrit :

Note : ce serait cool d'avoir un slide avec les différents groupe de travail. Pas forcément pour être montré en cours de présentation mais je pense que c'est une question qui risque d'être posée.

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-67019222.

Ezibenroc commented 9 years ago

Slides sur les groupes de travail: ok (à mettre après le slide "Questions ?", pour l'avoir sous la main au cas où).

marc-chevalier commented 9 years ago

Oui, en faisant attention de pas dépasser lors de la présentation.

Marc CHEVALIER

Le 15/12/2014 17:21, Tom Cornebize a écrit :

Slides sur les groupes de travail: ok (à mettre après le slide "Questions ?", pour l'avoir sous la main au cas où).

— Reply to this email directly or view it on GitHub https://github.com/ProjetPP/Papers/issues/21#issuecomment-67019646.

yhamoudi commented 9 years ago

Tu peux les redessiner en 2D, mais pas de façon plus progressive, on perd du temps pour rien. Les gens qu'on a en face n'y connaissent rien mais sont intelligents.

Redessiner quels arbres, ceux du question parsing ?

marc-chevalier commented 9 years ago

Certains mettent deux fois le slide "Question" pour être sûr de ne pas dépasser. Mais il faut truander les numéros de slides et je trouve pas que c'est une bonne pratique, mais franchement, je m'en fous.

marc-chevalier commented 9 years ago

Ceux de la partie Datamodel, les seuls qui ne soient pas en 2D.

yhamoudi commented 9 years ago

non merci, j'ai déjà mangé des figures tikz tout le week-end. C'est ta partie, c'est à toi de le faire :)

marc-chevalier commented 9 years ago

Quelle idée d'utiliser tikz aussi...

marc-chevalier commented 9 years ago

Et voilà. Et sans tikz. Seulement avec forest, comme dans le cours de compil.

yhamoudi commented 9 years ago

c'est très bien tikz, ça apprend la persévérance ;) sinon, merci pour les schémas (tu peux aussi mettre les formes linéaires en dessous à chaque fois, pour aider à comprendre ce qui s'affiche dans l'UI)

marc-chevalier commented 9 years ago

Un parcours infixe d'un arbre... je pense qu'ils savent, surtout après au moins un semestre de L3. Ils ont du voir et revoir ça en prog. Ca n'aidera pas et ça chargera de mettre les deux formes.

ProjetPP / Papers

Final demo review / TODO #21

[ Tel : 04.72.72.80.04 ][ Web page : http://graal.ens-lyon.fr/~ecaron ]