CaptainFact / captain-fact

📚 Documentation, wiki and community discussions
https://captainfact.io
67 stars 7 forks source link

Appel à définir la V2 de CaptainFact #106

Closed Betree closed 3 years ago

Betree commented 5 years ago

Avant-propos

Cela fera bientôt deux ans que l'expérience CaptainFact a débuté.

Cette période nous aura permis de tester une hypothèse selon laquelle la vérification d'information sur Internet peut devenir un sujet collectif dans lequel les citoyens ont un rôle à jouer.

Elle nous a aura aussi permis, à travers des partenariats tels que ThinkerView, la Tronche en Biais ou encore Heureka, de mobiliser des communautés qui souhaitent contribuer à la création d'espaces d'information bienveillants, dépassionnés et nuancés.

À travers les ambassadeurs, les contributeurs (sur le site comme sur le code source) et les donateurs, la dimension technique - qui seule n'est rien de plus qu'un squelette vide - a été dépassée par une force bien plus grande :

Nous sommes une communauté, unie autour de valeurs de transparence, de bienveillance et de factualité.

Si cette période nous a permis de nous construire, il nous faut aussi faire le constat de ce qui n'a pas marché et des problèmes de fonds que nous n'avons pas su solutionner à ce jour. Il y en a bien sûr d'autres, mais ceux-ci ont la particularité d'être structurels ; nous ne pourrions les régler à travers de simples mises à jour :

(1) Répétition des sujets

Vérifiez une vidéo qui désinforme sur le sujet des vaccins et vous aurez vérifié un seul des milliers de contenus sur le sujet. Combien de fois nous sommes-nous retrouvés à sourcer une affirmation sur les chiffres de la famine dans le monde ? Du chômage ? Sur le montant de l'évasion fiscale ?

(2) Diversité des contenus à vérifier

Pouvoir vérifier des articles, des documents PDF, des vidéos Facebook ou Viméo… la question revient systématiquement. Des intégrations pour ces différents types de contenus sont possibles, mais très coûteuses en temps de développement et de maintenance car elles doivent être réalisées au cas par cas. Raison pour laquelle aucune autre n'a été réalisée à ce jour.

(3) Quelle place pour les journalistes, à même d'enquêter en profondeur ?

Le pouvoir de la foule est un outil fantastique pour fouiller l'Internet, décortiquer des papiers de recherche, croiser les sources, relever des détails et signaler des erreurs.

Mais bien qu'il en soit devenu le totem, Internet ne représente qu'une partie du spectre de l'information. Comment une communauté en ligne pourrait-elle contacter quelqu'un pour recueillir un témoignage, accéder à des documents physiques ou attester de l'authenticité d'une preuve matérielle ?

Nous n'avons pas inclus les journalistes dans notre démarche. Je pense pourtant qu'ils ont autant à gagner à se rapprocher de communautés telles que CaptainFact que nous avons d'intérêt à les inclure dans la démarche complexe de vérification d'informations collaborative.

(4) Comment toucher des sphères plus larges ?

Sur ce sujet, peut-être plus que sur tous les autres, CaptainFact n'a pas été à la hauteur des enjeux initialement posés.

Notre posture quand à la participation et à l'ouverture n'a pas empêché un certain élitisme de s'installer ; le sondage réalisé il y a quelques mois l'avait montré : tant les visiteurs que les contributeurs du site sont des gens qui s'informent beaucoup, croisent leurs sources et adoptent déjà pour la plupart une posture critique.

Proposition

Aujourd'hui notre attention se concentre sur un type spécifique de contenu : les vidéos YouTube (potentiellement en direct). Il est maintenant nécessaire si nous souhaitons adresser ces problématiques de revoir l'objet de notre attention : nous devrions nous concentrer sur des sujets, et non pas sur des contenus.

Que serait un sujet selon CaptainFact ?

Un sujet dans le cadre qui nous intéresse pourrait être définit comme un énoncé composé de plusieurs citations indivisibles pouvant être vérifiées indépendamment, ainsi que de sous-sujets.

Exemples (non factuels) :


Representations visuelles de ces changements, par @Miragide

CF_Sujets

CFv2

Effets souhaités

Des mécanismes similaires

Bonne nouvelle : la plupart des interactions que nous avons mises en places à travers le temps correspondent à cette nouvelle approche et peuvent être réutilisées.

Par exemple pour définir qui pourra ajouter de nouveaux sujets, nous pouvons copier le mécanisme existant permettant de décider qui peut ajouter des vidéos sur le site.

Les systèmes de réputation, de signalement, de modération collective prennent tout leur sens ici.

Le temps réel, le fait de travailler sur une interface mise à jour en direct est également un critère obligatoire dans le cas de sujets d'actualités en cours, pour lesquels beaucoup d'informations peuvent fuser en très peu de temps.

Et maintenant ?

Ce texte n'est pas la proposition d’une nouvelle fonctionnalité, mais celle d’un changement de cap et une une invitation à revoir la façon même dont est pensé CaptainFact.

Elle doit se nourrir des réflexions de la communauté, des ambassadeurs, de @Miragide mais aussi de tous les acteurs qui réfléchissent à ces questions liées à l'information en partageant nos valeurs : citoyens, journalistes, chercheurs, militants, enseignants, passionnés…

Comment faire en sorte que cette refonte, ces changements démocratisent CaptainFact et qu'ils répondent à vos problématiques, celles que vous rencontrez en vous informant ou en vérifiant des informations ?

Quels sujets aimeriez-vous soumettre à la vérification collaborative sur cette nouvelle version ?

Aimeriez-vous jouer un rôle dans ces potentiels bouleversements à venir ? Lequel, comment ?

C’est à vous !

ThatIsAPseudo commented 5 years ago

C'est une très bonne alternative à la review de vidéos qui est présentée là ! J'ai plusieurs suggestions/remarques concernant cette nouvelle version :

HamidTiouti commented 5 years ago

Serait-il possible d’ajouter des trophées « réputation » pour les intervenants selon leur taux de déclarations vérifiées

Betree commented 5 years ago

Hello @HamidTiouti c'est un changement qui dépasse le cadre de la proposition de V2, tu peux ouvrir une nouvelle issue si tu veux discuter de ça.

Betree commented 5 years ago

@ThatIsAPseudo merci pour ces retours, c'est très riche.

Concernant le fait de ré-utiliser les données de Wikipédia je te rejoins à 100%, pas besoin de ré-inventer ce qui existe déjà. Qui plus est nous n'avons ni l’expérience ni la communauté de Wikipédia, et le fait de s'appuyer là dessus nous donne une base de contenus initiale très riche.

L'idée devient du coup d'être les plus efficaces possibles pour relier un fait présenté sur Wikipédia à une affirmation (dans une vidéo, un article...etc). Ça serait top d'avoir des Wikipédiens dans la boucle.

Edit: Après discussion et tests avec @Miragide, on en a conclut que Wikipédia ne peut pas servir de "base de donnée de faits centralisée". Il y a en fait un nombre limité d’éléments qui peuvent être vérifiés avec Wikipédia, en particulier sur les sujets d'actualité. Ça peut par contre être intéressant de suggérer des sources et des liens à partir de Wikidata.

Miragide commented 5 years ago

Voici d'autres visuels, des idées à méditer : cfv21 cfv22 cfv23 cfv24

Vayel commented 5 years ago

Vous en avez parlé aux partenaires ?

williamledoux commented 5 years ago

Je trouve que c'est une très bonne analyse et je suis ravi de la direction que vous prenez (ie. trier par thème plutôt que par média, et permettre de checker et de sourcer plus de types de médias différents).

Voici quelques réflexions en vrac, je ferais peut-être un mockup pour en illustrer certaines.

  1. Info synthétique et non redondante Quelque chose d'agaçant sur Twitter et dans les commentaires des sites d'informations, c'est cette impression de lire plein de fois la même chose, et en même temps de devoir en lire une bonne partie pour ne pas rater un point de vue intéressant. C'est un des trucs sur lequel Wikipedia a réussi, et kialo a échoué, selon moi. Sur kialo j'ai souvent ce moment ou je clique sur un sous argument pour lire les réfutations et je lis des réfutations qui ont rien à voir avec cet argument (et que j'ai souvent déjà lu sous d'autres arguments), au final passé la première impression d'une chouette organisation des arguments, on se rend compte qu'en pratique c'est un echec et c'est un vrai foutoir. Ca mérite réflexion, mais il ne faut pas sous estimer la nécessité et la qualité des outils pour découper, hierarchiser, marquer les duplications, merger les duplicats (avec historique), etc. et éventuellement des incitations pour utiliser ces outils.

  2. Lisibilité Il va y avoir beaucoup d'informations à l'écran, je pense qu'il faut épurer au maximum. pour canalyser l'attention du lecteur sur ce qui compte vraiment. Par exemple, sur le mockup, est-il utile d'avoir la date, l'avatar, le nom, la réputation de l'auteur, sachant qu'une bonne argumentation doit être recevable indépendamment de "qui parle" et de "quand" ? Wikipedia ne pourrait pas être aussi clair en affichant ce genre d'informations. Peut-être qu'un petit [i] permettant d'avoir un petit tooltip avec ces infos, et en cliquant d'aller à l'historique de cette contribution serait suffisant. C'est un exemple, mais je pense que c'est un filtre a appliquer à chaque élément du mockup. Les icônes des sources qui abordent ce sujet attirent beaucoup l'oeil également sans qu'on comprennent bien leur signification du premier coup.

  3. Sources Je trouve chouette l'idée de répertorier les sources qui parlent d'un sujet, ce serait bien de les numéroter, et de permettre leur utilisation dans les réfutations (genre [4@3m50s] pour pointer un passage de la vidéo [4]) et aussi d'ajouter automatiquement dans cette liste les sources qui ont été ajoutées directement dans les réfutations par les contributeurs.

  4. Validité de l'argument != Validité des prémisses Une des raisons de la désorganisation sur kialo c'est que c'est trop textuel et pas assez sémantique. Par exemple pour la citation fictive "La population d'abeilles diminue chaque année de X% à cause des pesticides et en particulier du glyphosate", il y a en fait plein de sous prémisses qui peuvent être contestées indépendamment ([diminue], [chaque année], [de 20%], [à cause], [des pesticides], [principalement du glyphosate]), et je pense qu'il est bénéfique de pouvoir les isoler comme des sous faits, par exemple, surligner "20%", et ne réfuter que ça, avec comme source la data "évolution annuelle des populations d'abeille" Du coup on peut surligner les parties de citations qui font l'objet de remarques en fonction de leur véracité, et du fait que ce sous sujet sois traité comme un sujet à part sur captain fact. (hum. un mockup ferait pas de mal... Je vais m'y mettre après)

  5. Au delà des faits Moi je cherche un moyen de me faire relativement rapidement une opinion mesurée sur un sujet donné. Il y a plein de sujets sur lesquels la validité des faits vérifiables et des arguments ne suffisent pas: à force de creuser, je trouve qu'on arrive souvent à un stade ou des valeurs qui ne sont pas explicitées sont nécessaires pour que l'argument sois valide. Par exemple, la citation fictive "les cameras de surveillance doivent être généralisées car elles réduisent de 20% les vols à l'arrachée" contient plusieurs infos cachées:

    1. 20% ça fait une diminution de combien, en euro ?
    2. et en nombre d'infraction ?
    3. il est plus important d'éviter X vol que de respecter la vie privée de millions de gens <= ça c'est une valeur.

    La citation fictive "Il faut arrêter les cameras de surveillance car leur coût dépasse le coût d'assurance des vols qu'ils évitent" contient aussi des valeurs sous jacentes: est-il important de punir les criminels même si ça coûte plus cher à la collectivité que de simplement réparer leurs dégâts ?

    Evidemment on ne peut pas "vérifier" ces valeurs, mais il peut être intéressant de les rendre explicites, car ce sont des prémisses manquantes à l'argument, ce qui équivaut à dire: cette citation n'est correcte que si l'on partage cette valeur X qui n'est pas citée. Parfois il y a des choses implicites qui gagnent à le rester, car partagées par tous, je dis pas qu'il faut tout expliciter, mais il faut pouvoir le faire.

  6. Extension et vie privée L'extension qui permet d'ajouter une source de n'importe quelle nature, c'est génial. Pour moi l'idéal serait carrément qu'on puisse annoter toutes les phrases d'un article, et que quand j'aille sur le site du Monde, l'extension me colore par parties le texte de l'article en fonction des réfutations qui ont été faites sur captain fact. Par contre ça pose des défis techniques pour anonymiser tout ça et ne pas donner à CaptainFact l'intégralité de mon historique de navigation (comment est-ce géré actuellement pour les vidéos ?)

  7. Rémunération des partenaires Sur un autre sujet, si je vais sur captain fact voir une video de thinkerview, et que je me contente de lire les annotations (qui pourraient aller jusqu'à un verbatim complet): Comment est-ce que thinkerview pourrait être rétribué sachant que je n'ai pas lancé la vidéo ? La question se posera aussi si (comme j'en rêve) la plus grande partie de certains articles pouvait être annotée, et du coup consultée sur captain fact plutôt que sur le site original. La question me semble importante pour pouvoir augmenter le nombre de partenaire qui acceptent que leur contenu soit repris sur la plateforme. Peut être que la solution est de ne pas reproduire le contenu sur le site de captain fact, laisser les différents sujets morcelés, et seuls les posesseurs de l'extension peuvent avoir le contenu entierement annoté (et consulter le détail d'une annotation sur captain fact)

J'essaie de faire un mockup pour coucher les idées dans un format plus communicatif.

sourisdudesert commented 5 years ago

Bonjour à tous,

Suite à une discussion sur Facebook avec Florence je me permet une "petite" intervention par ici qui vaut ce qu'elle faut.

Inutile de dire que je suis conquis par l'idée derrière CaptainFact. Le service qui réussira à réaliser cette idée deviendra un véritable "bien commun" au bénéfice de tous, comme peut l'être Wikipédia.

Ce qui va suivre n'est pas forcément en ligne avec ce qui a été maquetté plus haut: prenez le du coup comme ce qu'il est, à savoir une série de conseils sur le mode "si j'étais vous" venant d'un web entrepreneur - avec probablement beaucoup de défonçage de portes ouvertes.

1. L'audience cible

A qui CaptainFact s'adresse t il ?

Si j'étais vous, j'identifierais 2 cibles prioritaires: la communauté sceptique le grand public

2. Les besoins

Qu'attend la communauté sceptique ? Une encyclopédie du fact checking (comme il est indiqué plus haut).

Mon besoin est le suivant: je vois une info qui a l'air louche sur Facebook. J'ai besoin de savoir rapidement si cette info est véridique ou pas, et éventuellement j'ai besoin des informations et des sources nécessaires pour "hoaxbuster" immédiatement et efficacement.

Qu'attend le grand public ? Une position simple ("c'est vrai" / "c'est faux" / "c'est plus compliqué" / ...) sur un fait donné, qui proviennent d'un site structurellement neutre (donc ni un média, ni un espace de libre expression, ni un site de "réinformation",... en résumé quelque chose qui se rapproche de Wikipedia). Et éventuellement plus d'informations (sources, etc...).

3. La stratégie de croissance

En ce qui concerne le grand public, votre seule stratégie possible de croissance est le référencement.

Pourquoi ? Parce que même si cela fait 10 fois que j'ai suivi des liens menant à CaptainFact sur des sujets variés, et que j'ai commencé à intégrer dans ma petite tête que "il y a quelque chose qui s'appelle CaptainTruc qui est pas mal du tout et qui m'a l'air fiable et honnête", et bien je peux vous assurer que la prochaine fois que je me demanderai si "Le vaccin contre l'hépatite B donne-t il la sclérose en plaques ?", je taperai cette question dans Google. C'est moche, mais c'est la réalité: seule une minorité d'utilisateurs iront d'abord sur CaptainFact et utiliser la recherche CaptainFact.

Et la seule stratégie possible pour gagner la bataille du référencement... ce sont les liens entrants.

... et vous ne gagnerez des liens entrant qu'en étant d'abord et avant tout l'outil dont rêve la communauté sceptique pour tordre le cou à toutes les fake news.

"si j'étais vous", ma stratégie de croissance serait la suivante: se concentrer dans un premier temps sur la communauté sceptique, en étant à 200% à leur écoute et à leur service pour leur construire l'outil dont ils rêvent. intégrer les journaliste "fact checkeurs" en leur faisant une promesse simple: ça va vous faire gagner un temps fou, grâce à la mise en commun des efforts de tous les autres journalistes et de la communauté + des backlinks vers leurs articles. parallèlement à cela, proposer une version "grand public" (autrement dit: pour les utilisateurs non connectés et les moteurs de recherche) de vos sujets, en étant focus sur les deux éléments les plus importants: le statut du fait (vrai / faux / ...), et le "pourquoi vous pouvez nous faire confiance" (expliquer en quelque mots ce qu'est CaptainFact). au fur et à mesure que la communauté sceptique va s'approprier l'outil, ils vont poster de plus en plus de liens vers CaptainFact et vont vous faire monter dans les résultats Google.

4. Les mockups

Si je me suis permis d'écrire tout cela, c'est parce que - à mon sens - les mockups ci-dessus ne prennent pas cette direction.

Plusieurs choses qui me perturbent:

L'absence d'une page d'entrée simple

Pour le grand public, le besoin est extrêmement simple. J'ai besoin d'avoir 4 éléments sur la page: le sujet (ex: "Le vaccin contre l'hépatite B cause la sclérose en plaques"), le statut ("C'est faux"), la raison pour laquelle je devrais faire confiance à CaptainFact, et un mini résumé de quelques lignes des arguments avec - bien sûr - possibilité de lire plus à 1 clic de distance. Ca, ça n'existe pas sur le web actuellement, et c'est un besoin criant. Malheureusement, un internaute lambda qui arrive de Google et qui tombe sur l'un des mockups ci-dessus, il me semble qu'il va se demander où il est tombé bien avant d'avoir réponse à sa question. Bref, je pense qu'il faut conserver ces 4 éléments et virer tout le reste.

L'absence apparente de consensus

Ce qui saute aux yeux quand on voit les mockups, c'est qu'il semble y avoir 2 camps, qui sont mis à égalité ("confirmation" et "réfutation", un à gauche, un à droite). L'impression que cela donne, c'est qu'on nous dit "lit les deux cotés, et fait toi ta propre opinion".

Or il me semble que l'objet du fact checking n'est pas de se faire des "opinions", mais de savoir si le consensus global est que le fait est vrai ou faux.

J'ai l'impression qu'il y a là confusion entre "débat" et "encyclopédie". Si l'objectif est encyclopédique, alors le format "débat" n'est tout simplement pas le bon.

Pour parler concrètement, si je prend l'exemple du sujet "Les vaccins provoquent l'autisme", une confirmation est l'étude de Andrew Wakefield - étude dont (presque) tout le monde sait qu'elle a été biaisée. Est-ce que l'utilisateur de CaptainFact devra cliquer pour voir les sous-arguments pour se rendre compte que l'étude a été falsifiée ? Ou deviner au nombre de votes négatifs qu'il s'agit d'un mauvais argument ?

Il me semble qu'à partir du moment où il y a consensus pour dire que l'argument est faux, il doit tout simplement apparaître comme "faux" au premier niveau de lecture.

Et il me semble que si le "fait" présenté sur la page est "faux" de part le consensus, il doit apparaitre comme "faux" de manière non-ambigüe au tout premier niveau de lecture de la page.

Du coup, pour moi le besoin du grand public n'est pas rempli par le mockup présenté.

La granularité des sujets

Le point d'entrée d'un utilisateur sur CaptainFact, c'est un sujet précis.

Si je veux fact checker quelque chose sur le glyphosate, je vais entrer dans Google "Le glyphosate est-t il dangereux pour les humains ?" ou bien "Le glyphosate est-t il responsable de la disparition des abeilles". Je ne vais pas taper simplement "Le glyphosate". Et je n'ai pas envie de me retrouver sur une page gigantesque où je vais devoir trouver la réponse à ma question en cliquant sur des arguments et sous-arguments.

Du coup, pour moi vos "sujets" et "sous-sujets" sont de trop. Il n'y a qu'un seul concept qui a du sens sur un site de Fact Checking: un "fait". Après, les faits peuvent être liés entre eux de multiples manières (hashtag, références croisées dans les arguments et les sources, ...), mais au moins vos pages seront individuellement simples, répondront au besoin de ceux qui sont venu chercher l'info, et seront mieux référencées dans Google pour ces sujets précis.

5. l'international

Pour connaitre très bien le sujet (mon site a fait 6 mois - le temps de valider le concept - en FR uniquement avant de basculer en anglais, puis 35 langues aujourd'hui), c'est juste absolument indispensable dès lors que le concept est validé - c'est à dire qu'il a une croissance propre.

Tant que le concept n'est pas validé, vous avez une chance immense d'être en FR uniquement: le monde francophone est plus petit, vous pouvez plus facilement atteindre vos communautés cibles, et en même temps assez grand pour avoir largement assez de cobayes pour tester vos idées.

Faites en sorte dès maintenant - il me semble que vous avez commencé - que le service soit internationalisable, mais ne vous préoccupez pas trop de son internationalisation pour le moment. Dès que le site est viable et a une croissance propre, changez de pied et faites en une priorité. C'est ce qui a marché pour nous.

Conclusion

Désolé, c'était bien trop long, et j'ai sûrement enfoncé des portes que vous avez déjà ouvertes. Donc encore une fois prenez tout ça comme vous le souhaitez - et je suis disponible pour discuter de tout ça si vous le souhaitez. "My 50 cents" comme disent les anglo saxons.

Merci à vous, bon courage et tenez bon :)

Miragide commented 5 years ago

@sourisdudesert Merci beaucoup pour ton retour, riche en ouvertures et en remises en question (j'adore ça) !

1. L'audience cible D'expérience, j'ajouterais au public cible les militants qui ont besoin d'un média pour exprimer leur réalité, parfois déformée par les médias (le réchauffement climatique par exemple, ou sujet plus controversé, le gaspillage de l'eau). Aussi, cibler les communautés passionnées de science.

2. Les besoins

« Qu'attend le grand public ? Une position simple ("c'est vrai" / "c'est faux" / "c'est plus compliqué" / ...) sur un fait donné, qui proviennent d'un site structurellement neutre (donc ni un média, ni un espace de libre expression, ni un site de "réinformation",... en résumé quelque chose qui se rapproche de Wikipedia). Et éventuellement plus d'informations (sources, etc...). »

J'en prends bonne note pour améliorer la présentation des vérifications, sans pour autant la rendre grossière (car c'est souvent compliqué).

3. La stratégie de croissance Je te rejoins à 200 % hélas les technologies du site nous rendent actuellement invisibles au yeux de Google... solutionner ce problème est un gros chantier. Nous visons également ces données structurées : https://developers.google.com/search/docs/data-types/factcheck?hl=fr

  1. Les mockups Les dernières maquettes réalisées : Vidéo : https://www.figma.com/proto/ERpy0f1Ek4CSmLSZRQOFU1tC/CaptainFact?node-id=93%3A157&scaling=min-zoom Un sujet : https://www.figma.com/proto/ERpy0f1Ek4CSmLSZRQOFU1tC/CaptainFact?node-id=288%3A1346&scaling=min-zoom Formulaire d'ajout : https://www.figma.com/proto/ERpy0f1Ek4CSmLSZRQOFU1tC/CaptainFact?node-id=288%3A491&scaling=min-zoom Accueil / fil des vérifications : https://www.figma.com/proto/ERpy0f1Ek4CSmLSZRQOFU1tC/CaptainFact?node-id=119%3A1&scaling=min-zoom

« Pour le grand public, le besoin est extrêmement simple. J'ai besoin d'avoir 4 éléments sur la page: le sujet (ex: "Le vaccin contre l'hépatite B cause la sclérose en plaques"), le statut ("C'est faux"), la raison pour laquelle je devrais faire confiance à CaptainFact, et un mini résumé de quelques lignes des arguments avec - bien sûr - possibilité de lire plus à 1 clic de distance. »

Bien vu, je vais travailler dessus.

« Ce qui saute aux yeux quand on voit les mockups, c'est qu'il semble y avoir 2 camps, qui sont mis à égalité ("confirmation" et "réfutation", un à gauche, un à droite). L'impression que cela donne, c'est qu'on nous dit "lit les deux cotés, et fait toi ta propre opinion". Or il me semble que l'objet du fact checking n'est pas de se faire des "opinions", mais de savoir si le consensus global est que le fait est vrai ou faux. »

En pratique, il semble impossible d'afficher une certitude quant la bonne source. Vrai, ou faux, bonne ou mauvaise source, la réponse ne peut s'obtenir qu'après une confrontation et le passage de plusieurs contributeurs pour voter et « arbitrer ». Il semble impossible d'exclure un débat par les faits, pour trouver la source et la réponse adaptée. D'où l'utilité d'un outil collaboratif. Ceci dit je te rejoins dans l'idée que l'on peut mettre davantage en exergue les résultats, lorsqu'ils sont tranchés.

« "sujets" et "sous-sujets" sont de trop »

Je trouve au contraire que le contexte est très important et que présenter les sujets similaires à la fin, invite l'utilisateur à se renseigner davantage. Qu'est-ce qu'ils coûtent ? Nuisent-ils vraiment à la clarté ou au référencement ?

  1. l'international Oui nous sommes dans cette optique. Bravo pour votre internationalisation :)

Merci encore pour ton retour ! N'hésite pas à passer sur notre serveur discord pour en discuter davantage : https://discord.gg/Z22Vhda En tout cas je ferai bientôt de nouvelles propositions de maquettes pour mettre en application les remarques.

PS : J'ouvre une autre réponse pour William.

williamledoux commented 5 years ago

PS : J'ouvre une autre réponse pour William.

Du coup ça m'a boosté pour faire mon mockup, j'espère que ça exprime mieux ma pensée et que ça pourra vous être utile. Je suis sur discord si besoin

captainfact

Miragide commented 5 years ago

Merci @williamledoux j'allais justement te demander des nouvelles de la maquette :)

1- Info synthétique et non redondante C'est un défi, une nécessité qui est comprise et tes propositions sont de bonnes idées pour y remédier.

2- Lisibilité Je suis souvent partagée entre esthétique (pour donner envie aux personnes d'utiliser le site) et sobriété (« pour canaliser l'attention du lecteur sur ce qui compte vraiment »). Je vais proposer de nouvelles maquettes avec moins d'informations, comme tu le suggères.

Il y a plein de sujets sur lesquels la validité des faits vérifiables et des arguments ne suffisent pas: à force de creuser, je trouve qu'on arrive souvent à un stade ou des valeurs qui ne sont pas explicitées sont nécessaires pour que l'argument sois valide. Par exemple, la citation fictive "les cameras de surveillance doivent être généralisées car elles réduisent de 20% les vols à l'arrachée" contient plusieurs infos cachées [...]

D'où l'importance de mettre en avant le contexte, les autres vérification pour le même sujet. Pour plus tard, j'imaginais la possibilité pour des utilisateurs de créer des « dossiers » : une liste de vérifications de leur choix, plus large qu'un sujet, pour les aider à réunir les informations nécessaires, leur permettant se faire une opinion éclairée, mais aussi pour leur permettre de le partager. D'ailleurs, en un sens, les vidéos seraient une forme de dossier, listant les vérifications en rapport avec la vidéo en question. Une utilisation pratique serait pour la prise d'une décision politique comme l'interdiction de l'utilisation de certain pesticide : un dossier pourrait être ouvert comportant toutes les vérifications CaptainFact au sujet des pesticides en question. Pour l'occasion, les personnes pourraient débattre et compléter les vérifications du dossier, pour prendre une décision en cohérence avec les faits. Car aujourd'hui, quels sont les outils pour prendre des décisions logiques, en cohérence avec les multitudes de recherches ?

6- Extension et vie privée Tous les détails sont à ce lien : https://captainfact.io/help/extension

Pour moi l'idéal serait carrément qu'on puisse annoter toutes les phrases d'un article, et que quand j'aille sur le site du Monde, l'extension me colore par parties le texte de l'article en fonction des réfutations qui ont été faites sur captain fact.

C'est également ce dont je rêve :)

7- Rémunération des partenaires Il me semble que la plupart des partenaires ne sont pas rémunérés à leur nombre de vues. Heureusement, car la rémunération Youtube est minable.

Merci pour la maquette, je vois mieux où tu veux en venir. Je vais essayer de réaliser une nouvelle maquette qui correspond, suite à quoi j'aimerais beaucoup en discuter avec toi sur Discord. Je te tiens informé.

sourisdudesert commented 5 years ago

Bonjour à tous,

Merci encore pour votre précieux travail :)

Je me suis permis de faire 3 petites maquettes que je poste ici. C'est très incomplet et très perfectible. C'est plus pour donner des pistes que pour servir de base de travail.

J'ai d'abord essayé de coucher sur l'écran ce que j'aimerai voir en tant que visiteur, donc en tant que personne qui ne connait pas CaptainFact et qui est probablement arrivé en tapant des mots liés au sujet dans Google.

Personnellement, voici ce que j'aimerais voir:

sujet_visiteur_plus_complique

Ceci illustre ce que j'ai dit plus haut, à savoir:

Note: il faut probablement remplir l'espace de droite par des suggestions automatique de sujets en relation.

J'ai fais la même chose pour un sujet "c'est vrai" (et désolé pour la faute d'accord):

sujet_visiteur_vrai

Par ailleurs, voici ce que j'attendrais lorsque je poste une nouvelle réponse sur un sujet:

ajouter_reponse_couleurs

Je n'ai pas forcément vocation à contribuer au delà de ceci, mais je voulais a minima vous exprimer visuellement mes attentes vis à vis d'un site tel que CaptainFact :)

Bon courage !!

williamledoux commented 5 years ago

J'aimerai partager avec vous les changements radicaux que j'aimerai voir survenir dans le monde du fact checking.

Des sites dédiés qui débunkent de manière tranchée (avec une signalétique facile à lire, genre feu tricolore) en face de sujets assez atomiques, il y en a plein. Tous les sites de factchecking récents le font sous une forme ou une autre. Par exemple HoaxBuster le fait depuis 20 ans, dans l'indifférence quasi-générale, et est également collaboratif via le forum sur lequel les sujets sont traités avant de faire la une.

Pourquoi je n'utilise pas davantage ces sites alors que je les connais depuis 20 ans et que le factchecking est hyper important pour moi ? Je vois plusieurs choses:

  1. Pas d'usage ponctuel Quand je lis de la merde, sois je m'en rend compte et j'ai pas besoin de fact checking pour voir que c'est un hoax, soit je m'en rend pas compte et du coup je n'ai pas le réflexe ni la patience de chercher à vérifier chaque truc que j'ai lu quelque part sur un site de factchecking (encore moins sur tous les sites de factchecking puisqu'il n'y a pas de meta moteur de factchecking à ma connaissance).

  2. Pas d'usage récurrent Je ne vais pas non plus consulter la une de ces sites de temps en temps. Principalement parce que pour moi ça consiste à lire principalement des trucs faux, et ensuite parceque ça veut dire se faire imposer une ligne éditoriale (quels sujets sont checkés, lesquels ne le sont pas) et souvent les sujets sont justement des buzz très éphémères, qui ne m'intéressent souvent pas vraiment. image Certes, je préfère savoir qu'une intox est fausse plutôt que penser qu'elle est vraie, mais la plupars du temps, j'aurai pas eu l'info du tout je m'en porterai pas plus mal. D'autant plus que je pense que notre jugement est altéré par la lecture répétée de trucs faux, même en sachant que c'est faux. Là pour le chiffre de 50%, j'ai beau avoir un FAUX rouge à côté, (surtout si j'ai pas le vrai chiffre), mon cerveau va retenir ce chiffre et si on m'interroge il aura influencé ma réponse.

Bref. du coup les sites actuels de buzz-checking ne répondent à aucun de mes vrais besoins. Pour moi il y a donc deux choses qui peuvent radicalement faire la différence dans le domaine du fact-checking.

  1. Annoter l'information là où elle se trouve. Je veux être prévenu quand je lis de la merde (ou un truc solide) directement là où je l'ai lu. Quel que soit le format: texte, vidéo. Quelle que soit la taille: de la citation reprise sur twitter jusqu'au programme politique ou à l'article de fond du monde diplo. En gros, une annotation collaborative du web.

  2. Ne pas se limiter à des sujets simples Par contre, je veux aussi me faire un avis synthétique, éclairé et mesuré (dépassionné) sur un sujet de fond, complexe, qui fait débat et sur lequel une réponse tranchée ne sera probablement pas possible. Et dans ce cas je suis prêt à aller sur un site dédié pour chercher ce sujet (comme je pourrais aller chercher "pesticides" ou "energies renouvelables" sur kialo, si c'était à la hauteur). Et ces débats pourront être repris pour annoter le web, pas seulement sur des sujets futiles comme la dernière déclaration de machin, mais aussi quand ces sujets serieux sont abordés, dans des discours, articles, programmes politiques.

Miragide commented 5 years ago

cfv2

MaartenLMEM commented 4 years ago

Bonjour, Je rejoins William Ledoux sur l'importance de faire le diagnostic à partir d'expériences utilisateurs, les nôtres, la sienne, celles des utilisateurs réelles et celles de différentes personnes faisant partie des cibles privilégiées du projet. Sur ce plan, y a t il un recueil de témoignages ? Y a t il des tests utilisateurs qui ont été faits ?

Concernant l'idée d''annoter, pour notre propre projet (Dismoi), j'ai fait une petite note sur un projet américain qui a levé des millions d'euros et dont vous avez sans doute entendu parlé : Genius. Attention c'est une note que j'ai rédigé sans penser au fact checking en particulier, mais elle me semble pouvoir être utile ici car elle est centrée sur l'expérience d'information : https://docs.google.com/document/d/1_U3cpzOLh4sI0xysxahEFxjmiZq23tTVHA1qwu7oXJM/edit#

Enfin j'aimerai vous partager une considération plus fondamentale, plus abstraite (et j'espère pas trop). Il s'agit d'importance de différencier les problèmes et les solution, les questions et les réponses, de ne pas les rabattre dans une savoir thématique et propositionnel. Lorsqu'on s'intéresse à des faits, à des énoncés, questionner est le plus important, problématiser est l'essentiel de l'activité de connaître. La réponse elle en découle. Vous trouvez un écrit à ce sujet sur les savoirs scolaires ici : https://journals.openedition.org/rfp/823 (M. Fabre a été mon prof). L'introduction me semble un bon avertissement contre un voix à ne pas suivre. Vous y trouverez également le problème de Ménon qui est le même que celui décrit plus haut par William Ledoux.

williamledoux commented 4 years ago

Merci @MaartenLMEM, je ne connaissais ni le dilemme du Ménon, ni Genius Web Annotator !

Pour moi l'annotation partout est vraiment la solution à la visibilité du fact checking.

Voici mes contraintes principales:

  1. Le faire en respectant la vie privée. c'est à dire sans faire une requête pour chaque site consulté, ce qui reviendrait à transmettre in fine tout l'historique de navigation à la base de donnée du fournisseur de l'extension.

  2. Gérer les annotations faites sur des portions de page qui ont été modifiées depuis (parceque l'article a été mis à jour, ou parceque cette partie du site était dynamique, genre les 5 commentaires les plus lus)

  3. Que ça marche dans le plus d'endroit possible, c'est parfois dans les blogs les plus reculés du web qu'on n'a le plus besoin d'avoir l'annotation collective car on ne peut pas se baser sur la réputation de l'auteur ou de l'éditeur du contenu.

Voilà comment j'imagine que l'extension devrait procéder techniquement:

  1. On fait des chunks L'extension découpe la page que je visite en plusieurs chunks censés contenir du contenu (texte ou media). Exemple de politique de découpage:
    • Je prend toutes les balises <h1> à <h6> <p> <cite> <code> <legend> etc.
    • On peut éventuellement ignorer ces balises si elles ne font pas partie d'un tag plus général censé être une partie importante de la page (ex: <article> <aside>)
    • On pourrait aussi avoir une politique de regroupement (si deux p sont contigus) mais je pense que c'est une mauvaise idée.
    • On peut imaginer avoir des politiques spéciales pour certains sites populaires pour améliorer le support
  2. On, calcule un ID pour chaque chunk Sur chacun des chunks, on nettoie le contenu pour ne garder que le texte (suppression de tout les tags html <br> <a href="...">, puis on calcule le hash du contenu nettoyé, ce qui constitue l'ID de ce chunk.
    1. On récupère les annotations des chunks de la page On fait une requête vers la db avec la liste des IDs des chunks à récupérer et on reçoit en retour un json avec les annotations pour chaque chunk.
      • Comme la requête ne contient que des IDs de chunk, elle ne dévoile pas la page sur laquelle je me trouve, en revanche une analyse du contenu des annotations peut donner des informations sur le type de contenu. Une analyse des chunks demandés en commun par différentes personnes peut permettre de faire des clusters avec intérêt commun.
      • On peut imaginer faire (ou proposer de faire) cette requête via Tor pour anonymiser davantage
      • Comme les annotations sont récupérées sur la base de l'ID du chunk et que cet ID dépend du contenu, si un chunk a été modifié (un article mis à jour, un commentaire édité) les deux versions du chunk sont considérées comme deux chunks différents, donc les annotations avant édition ne pourrons pas être récupérées pour ce chunk. C'est pour ça que je pense qu'il ne faut pas faire des trop gros chunks (et donc ne pas regrouper les <p> contigus) pour perdre le moins de chose possible en cas d'édition.
      • Inversement, si on se débrouille bien, un tweet a été annoté sur twitter et cité sur lemonde pourrait avoir le même ID, et les annotations sur ce tweet seraient visibles dans les deux endroits. Ca demande peut-être un peu de preprocess du contenu avant hash, mais ça semble pas infaisable image
    2. Que contiennent les annotations ? Est-ce que les annotations sont des réécritures, des commentaires, des liens vers des articles plus fouillés de captain fact, c'est un autre sujet, ici j'ai voulu plutôt aborder la faisabilité technique.

Comme d'hab, vous pouvez me poke sur le discord pour en discuter :)

lutangar commented 4 years ago

Le web de l’annotation ce n’est pas nouveau, un groupe de travail du W3C s’est penché dessus et a publié ses recommandations et notes dans un document : https://www.w3.org/blog/news/archives/6156

Autant se reposer sur les épaules d’un géant !

Cette présentation décrit plutôt bien son fonctionnement : https://www.w3.org/annotation/diagrams/annotation-architecture.svg

Certains l'ont même implémenté, par exemple Hypothesis, plutôt orientée recherche et publications : https://github.com/hypothesis/client

D’autres sont aller encore plus loin, en associant ça à un système de publication ActivityPub. Le manifeste est écrit avec ce système et le texte est super bien fichu, à lire absolument : https://csarven.ca/dokieli-rww

Bien que je trouve ça incroyable, et qu'à terme cela amène un vrais changement de paradigme, je me pose cette question : Es-ce que les utilisateurs sont prêt à aller aussi loin ? Es-ce que l’UX n’est pas trop riche et complexe, et donc s'adressera à une part plus réduite de personnes ?

Je ne sais pas si il est facile de concilier les deux : diffuser au plus grand nombre et/ou diffuser l’information la plus contextualisé possible (et donc plus pertinente?).

Peut-être peut-on imaginer plusieurs niveaux d’inceptions en fonction des profils. En gardant un niveau qui permet de garder UNE informations principale par page, et d’augmenter la granularité si souhaité. Mais cela augmente encore la complexité en multipliant les missions, au risque d’en négliger la principale.

williamledoux commented 4 years ago

Merci encore une fois pour me faire découvrir des choses. J'ai lu rapidement mais avec intérêt la spec Web Annotation Data Model du W3C.

A première vue je pense que le fait de relier l'annotation à une URL, et à un emplacement précis dans la page (avec les selecteurs), est

  1. peu robuste au contenu dynamique,
  2. fragile (un site qui veut empêcher les annotations peut imaginer des stratagème de balises aléatoires pour niquer tous les sélecteurs),
  3. pas respectueux de la vie privée, puisque ça revient à donner à l'hebergeur d'annotation la possibilité de lier des gens à des contenus.

3 problèmes qui me semblent était largement mitigés avec la solution des chunks basés sur le contenu, plus le bénéfice de pouvoir avoir des annotations communes à plusieurs sites.

En revanche il y a des choses que j'aime bien comme la notion de motivation de l'annotation. Je comprend l'intérêt d'un tel standard, car s'il était supporté par les navigateurs, cela permettrait à plusieurs acteurs de se proposer en tant que fournisseurs d'annotation sans avoir à gérer la partie client.

Mais à choisir je préferai installer une extension qui respecte ma vie privée qu'une extension qui respecte un standard.

Il me reste à lire davantage à propos de dokieli, notamment le côté décentralisé

williamledoux commented 4 years ago

Hello, @Miragide et @Betree est-ce que ces sujets ont décanté, quelles sont vos orientations pour la V2 ?

MaartenLMEM commented 4 years ago

Bonjour, Je me permets d'insister sur les limites déjà rencontrés par des projets basés sur des "chunks basés sur le contenu" et que j'ai décrites en détail ici. . Le principal problème est que l’annotation ne dit rien de son auteur ni de son intention (compléter, interpréter, contredire, questionner, fournir une source supplémentaire, etc.) tant que le lecteur n’a pas cliqué dessus. C'est une epxérience stressante pour les utilisateurs. Pour donner une image, je suis dans un couloir et il y a plein de portes sans rien écrit dessus.

Aussi, l'approche de fact checking par proposition repose sur une vision du savoir éculée. Pour le dire simplement : c'est un grand risque de contre sens que d’abstraire les énoncés des questions qui les sous-tendent. C'est d'ailleurs la continuité des savoirs scolaires sans enjeux, sans problèmes.

Par ailleurs @williamledoux concernant l'approche par bloc qui fait sens, typiquement la page web ou la vidéo :

williamledoux commented 4 years ago

Bonjour @MaartenLMEM,

J'ai pas trouvé comment marche DisMoi techniquement, quelles sont les requêtes effectuées pour aboutir à ce que la bulle apparaisse sur la page visitée ? je trouve que la page sur la vie privée ne m'en dis pas suffisamment pour me rassurer. En tout cas je trouve le concept très chouette, et assez proche de ce que je décrivait sur l'annotation là où l'information se trouve.

Je suis pas sûr de bien vous comprendre sur les réticences à l'annotation, le fear to miss me semble mitigeable en fonction de l'UX des annotations, on pourrait peut être faire un vocal tous ensemble, les sujets sont intéressants

MaartenLMEM commented 4 years ago

Bonjour @williamledoux Merci pour ta question sur le fonctionnement exact et la vie privée. Je suis d'accord, ça manque de précision. Ta question va nous y aider. Sur l'expérience utilisateur de l'annotation textuelle, le journaliste utilise effectivement le "fear to miss" pour exprimer le problème qu'il a ressenti. L'obstacle qu'il y a derrière est le fait que je ne sais pas qui a annoté et je n'ai pas d'idée de l 'objet de l'annotation si elle est signalée dans le texte. Mais si tu vois un moyen de dépasser cette difficulté, à savoir donner une "prévisualisation" du sens de l'annotation sans obstruer la lecture du texte, tu résoudrai un problème important, que des centaines milliers de dollars payés à des UX designer de Genius n'a pas résolu jusque là, dans cette voie de l'annotation textuelle. Oui tout à fait intéressé par un échange vocal. On organise ça à deux et on voit qui se greffe ? Ou bien on se greffe à un évènement existant ?

Betree commented 3 years ago

Je déplace vers https://github.com/CaptainFact/captain-fact/discussions pour garder les issues concentrées sur les solutions techniques concrètes. Pour celles et ceux que ça intéresse, l'idée a abouti sur cette proposition technique : https://github.com/CaptainFact/captain-fact/issues/191.

Merci à tou(te)s d'avoir participé à cette discussion !