FreederTeam / Freeder

An easy-to-use free feed reader
Other
5 stars 1 forks source link

Vie privée #10

Open Phyks opened 10 years ago

Phyks commented 10 years ago

Salut,

Je voulais virer les redirections et autres trackers pourris dans les flux.

Je connais déjà ceci https://github.com/ldleman/Leed-market/blob/master/urlclean/urlclean.plugin.disabled.php qui va en traiter certains, mais je ne suis pas certain qu'il traite tout.

Donc si vous avez des flux avec de tels problèmes, listez-les :)

tmos commented 10 years ago

Attention, le plugin de Leed rend certains flux inutilisables…

eliemichel commented 10 years ago

Faudrait un truc à la NoScript, où on autorise au cas par cas si on veut. Et faut faire gaffe à ne pas frustrer les utilisateurs non avancés : ne pas activer par défaut tout ce qui est susceptible de vraiment casser un flux pas si mauvais que ça.

Phyks commented 10 years ago

Clairement, ça ne doit pas casser quoi que ce soit.

Pour feedburner, la structure devrait être toujours la même et ne pas casser je pense. Je vais regarder en détails.

Phyks

On 18 juillet 2014 13:25:19 UTC+02:00, Elie Michel notifications@github.com wrote:

Faudrait un truc à la NoScript, où on autorise au cas par cas si on veut. Et faut faire gaffe à ne pas frustrer les utilisateurs non avancés : ne pas activer par défaut tout ce qui est susceptible de vraiment casser un flux pas si mauvais que ça.


Reply to this email directly or view it on GitHub: https://github.com/Phyks/Freeder/issues/10#issuecomment-49420782

tmos commented 10 years ago

Pour feedburned, ça pourrait être sympa de récupérer le lien vers le flux rss d'origine dès l'ajout, on proposerait un «souhaitez vous utiliser le flux original ? Cela respecte mieux votre vie privée, mais peut parfois mal fonctionner». Ou alors un plus général : «Souhaitez vous que Freeder modifie ce flux afin de protéger votre vie privée ? Cela peut parfois engendrer des comportements étranges. Plus d'infos ici (lien vers une page du site où on explique pourquoi feedburner c'est mal, comment on anonymise, etc). Zen pensez quoi ?

eliemichel commented 10 years ago

Je suis assez pour, mais faut faire attention à comment tourner la phrase :

tmos commented 10 years ago

Certes, mais aujourd'hui le script de filtrage de Leed pose quand même des problèmes sur certains sites, et il ne faut pas se le cacher, donc autant avertir clairement l'utilisateur que ça peut foirer, auquel cas il suffit de le désactiver pour le site. +1 pour le «c'est la faute du flux qui ne respecte pas votre vie privée» par contre !

On pourrait même faire la vérification de notre côté pour voir si ça marche non ? Par exemple afficher le dernier article du flux feedburner et le dernier article du flux traité, et demander «est-ĉe que c'est ok ?» si oui, c'est bon, si non, ça laisse le feedburner et ça nous remonte l'info !

eliemichel commented 10 years ago

Ça peut être intéressant de partager ces infos, genre avoir une petite base de donnée des flux qui marchent en appliquant tel ou tel filtre.

tmos commented 10 years ago

Oui, mais faudrait pas faire ça de façon trop formelle je pense : ce sont des données très temporelles (le jour où feedburner est stopé, plus rien n'est vraiment valable). Et hormis Leed (et encore, juste le mainteneur de l'extension), ça ne concerne pas 12 000 personnes… Mais je pense que ça reste une bonnée idée de partager ça d'une façon un peu plus lisible qu'en vrac au milieu d'un fichier php ;)

eliemichel commented 10 years ago

T'as raison, de façon général tout ce qui relève de la centralisation ne doit pas être complètement officiel. Ça doit être là à titre indicatif puisque ça repose sur le bon vouloir des éventuels utilisateurs et que même si c'est « crowd reviewed » rien n'empêche que quelqu'un s'amuse à tout casser.

En fait faut prévoir de pouvoir partager cette info entre plusieurs instances de Freeder, sans nécessairement que ce soit à grande échelle. (J'aime le côté social de la chose =D)

tmos commented 10 years ago

Tu as raison, a mon avis le plus simple est que ça remonte chez nous, on traite et on déploie ensuite aux instances via les majs :)

On 18 juillet 2014 14:58:05 CEST, Elie Michel notifications@github.com wrote:

T'as raison, de façon général tout ce qui relève de la centralisation ne doit pas être complètement officiel. Ça doit être là à titre indicatif puisque ça repose sur le bon vouloir des éventuels utilisateurs et que même si c'est « crowd reviewed » rien n'empêche que quelqu'un s'amuse à tout casser.

En fait faut prévoir de pouvoir partager cette info entre plusieurs instances de Freeder, sans nécessairement que ce soit à grande échelle. (J'aime le côté social de la chose =D)


Reply to this email directly or view it on GitHub: https://github.com/Phyks/Freeder/issues/10#issuecomment-49427522

eliemichel commented 10 years ago

Mmh je sais pas si on s'est compris. J'ai parlé de ne pas centraliser justement. ^^

tmos commented 10 years ago

Donc tu veux faire communiquer les instances entre-elles ?

Pour finir, ça n'ajoute absolument rien de «social», les utilisateurs ne verrons pas d'amélioration à leur échelle. Et même à petite échelle (aka deux installations sur le même serveur), ça va être un bordel monstre.

Selon moi, à partir du moment où on à besoin d'une intervention des devs sur ces infos, ça doit repasser par la case départ, donc autant propager ça avec les updates régulières : par exemple la prise en charge d'un nouveau site pour l'anonymisation entrainera une notif : «vous avez N nouveaux flux qui peuvent être améliorés !».

eliemichel commented 10 years ago

Wow. Je disais juste ça en pensant aller dans ton sens mais c'est sûr que t'as raison. Je pensais pas vraiment à un truc automatique, je voulais juste dire qu'on ne pouvait pas dire « Ça, la team a vérifié, c'est sûr c'est bon. » et que donc ce genre de pseudo-assurance devrait se faire à plus petite échelle, au sein d'un groupe de personnes qui se font confiance.

Pour le « Social » c'était une joke. =P Même si lorsqu'on voudra ajouter un plugin Social les instances se mettrons nécessairement à communiquer.

tmos commented 10 years ago

xD ok je me suis un peu excité pour rien là faut croire, mes plus plates excuses ! Je pense que la fonction d'amélioration de la vue privée est quand même à considérer avec attention : c'est une très bonne chose, mais le traitement des flux reste du cas par cas, du coup je vois mal comment se passer du regard des devs sur la chose.

Voilà, encore désolé, on s'est mal compris, j'ai cru voir un clone de diaspora arriver à l'horizon, j'ai pris peur :D

Phyks commented 10 years ago

Wow, grosse discussion… Pile quand je suis occupé =(

@tmos, tu aurais un exemple de flux cassé stp ?

tmos commented 10 years ago

Hélas non… Une des personnes pour qui j'héberge un Leed avait ralé, et je m'étais empressé de désactiver l'extension, rien de plus … :/

Phyks commented 10 years ago

Si on résume :

  1. Proposer de chercher le flux réel à l'ajout d'un lien feedburner.
  2. Virer les paramètres de tracking dans les URLs (xtor, utm_ and co).
  3. Essayer de retrouver l'adresse réelle des événements qui ont une adresse avec un tag (type thehackernews).

Pour 3, l'URL ne fonctionne pas de base, car c'est pas une URL. Donc on prend pas grand risque à la casser un peu plus :)

Pour 2, Faut faire ça proprement.

Pour 1, on cherche un lien RSS qui matche, si on trouve pas (ou s'il n'y a aucun flux), ça veut dire qu'il y a un problème et on ajoute feedburner, comme ça on casse rien.

EDIT: After a quick check, 1. seems very unlikely… Most of the sites using feedburne / feedpress that I saw are running Wordpress and the Wordpress plugin is automatically redirecting to these services so that the original link does not exist anymore… =(

eliemichel commented 10 years ago

Pour 2., l'utilisation du champ <link rel="self" /> des flux n'est-il pas une solution ? Les paramètres de tracking ne devraient pas y être.

tmos commented 10 years ago

+1 pour le self, et il me semble aussi que Feedburner garde l'url du flux d'origine dans le code… Pas compris le 3 par contre :|

eliemichel commented 10 years ago

Pas compris le 3 non plus d'ailleurs…

Phyks commented 10 years ago

Ok, prenons un flux pour démo : http://feeds.feedburner.com/TheHackersNews?format=xml

Le self est remplacé par le lien feedburner (de toutes façons, même s'ils laissaient le lien du flux WordPress d'origine, celui-ci retourne un 301 Moved Permanently vers Feedburner.

Le lien des articles est http://feedproxy.google.com/~r/TheHackersNews/~3/ydssKpv75-s/new-variant-of-havex-malware-scans-for.html (beuuuuuuuuuurk). Mais feedburner conserve en effet le lien d'origine dans un tag à lui (quand on peut faire simple…):

<feedburner:origLink>http://thehackernews.com/2014/07/new-variant-of-havex-malware-scans-for.html</feedburner:origLink>

(Au passage, pourquoi faire une extension de noms avec feedburner: quand on pourrait le faire avec la spec de base avec un rel=alternate ou un truc du genre ?!)

Enfin, le guid est tag:blogger.com,1999:blog-4802841478634147276.post-6952629369817198993 et je crois que Leed l'utilise pour le lien du titre, donc les articles ne sont pas cliquables… Mais je crois qu'osef nous en fait, car il suffit de parser le flux proprement.

Feedpress par contre est plus cool, et il n'y a rien à faire avec eux : http://feedpress.me/blogapart

J'ai pas de flux avec des paramètres de tracking en stock. Si vous en avez, faîtes circuler, sinon je repousse l'implémentation.

eliemichel commented 10 years ago

Si les gens veulent utiliser feedburner y a pas de raison de les en empêcher. C'est un problème de vie privée pour l'emmetteur du flux, pas le lecteur.

Quand quelqu'un utilise feedburner, c'est pour éviter que tout le monde fasse ses requêtes directement sur son site et le fasse sauter (même si c'est plus ou moins légitime et parfaitement inutile lorsque couplé à l'utilisation de plateformes anti-DDoS comme CloudFlare) donc ça me semble pas une bonne idée de dire « Je m'en fiche, je vais quand même lire à la source. »

tmos commented 10 years ago

Personnellement ce n'est pas tant la source de récupération de l'article qui me choque (enfin si, mais bon c'est un choix de l'admin comme le dit Élie…). C'est surtout le lien sur la balise de titre.

Exemple :

L'idéal étant selon moi de checker si l'adresse du flux original marche, si oui, la récupérer (mais là ça peut foirer ou même aller à l'encontre du choix de l'admin comme le dit Élie, il faut donc bien réfléchir), mais surtout, de changer le lien à rallonge de Feedburner (cf ci-dessus) par un lien potable.

Il faut concilier tout ça avec le fait que déléguer ses flux RSS peut avoir une réelle utilité, comme le dit Élie.

eliemichel commented 10 years ago

Ah oui par contre les liens comme ça on peut les filtrer. Après Korben a peut-être envie qu'on mette ça pour qu'il fasse ses petites stats…

tmos commented 10 years ago

En tant qu'utilisateur, c'est à moi de choisir ce que j'accepte de donner, ce n'est pas au webmaster de décider ce qu'il prend. Je peux tout à fait choisir d'utiliser son lien feedburner ou le lien de base. C'est mon choix de vouloir ou non donner toutes ces infos. Piwik par exemple (tracking open source) permet aux utilisateurs de choisir de ne pas êtres suivis via un cookie.

Cette option ne sera pas obligatoire, donc si je veux aider Korben [et google] dans ses stats, libre à moi de ne pas anonymiser le lien.

Selon moi, c'est à l'utilisateur de choisir si oui ou non, il souhaite donner ses infos. Et donner ce choix via un simple bouton, c'est peut être le premier pas vers un questionnement de la part des «non concernés».

(PS: après relecture je trouve que ce dernier post à de la gueule, je vais peut être en faire un article :D)

Phyks commented 10 years ago

@tmos: sur le flux de Korben, il y a ce genre de tags:

<feedburner:origLink>http://korben.info/bernard-cazeneuve.html</feedburner:origLink></item>

comme sur celui que j'avais linké plus haut. Je vais parser ce tag en plus, et on devrait dégager les merdes de proxy de feedburner.

Virer les paramètres en plus, _utm and co, normalement il ne devrait pas y en avoir dans les liens des flux du coup (puisque c'est des trucs Google, rajoutés par Feedburner, et que ça n'apparaît pas dans le origLink).

Et après, pour récupérer l'URL de la source, c'est pas si évident en fait… Certains comme Korben ont encore le flux de base fonctionnel, mais la plupart redirige de façon transparente vers Feedburner. Et trouver l'URL de base du flux, c'est pas évident (pour un wordpress, c'est censé être /feed, mais dans le cas général, je ne sais pas…).

eliemichel commented 10 years ago

Fait gaffe à pas patcher le parseur RSS de base trop violemment. Il faut pouvoir discerner ce qui est le standard de ce qui concerne ce genre d'optimisation.

Phyks commented 10 years ago

Ouais, t'inquiète :)

tmos commented 10 years ago

C'est déjà pas mal du tout d'avoir un lien propre :) Mais même ça doit être inclu dans l'option «forcer le respect de la vie privée». [edit: ah ben oui, tout le monde à l'air d'accord là dessus :)]

Dans l'ordre selon moi :

Phyks commented 10 years ago

Ok, dans le dernier commit j'ai ajouté ce dont je parlais.

Dans le parser, je regarde si je trouve un tag origLink dans le NS feedburner. Si oui, je l'ajoute à la liste des liens, avec un rel=origLink.

En résumé, $entry['links'] est un tableau de liens, contenant url, title et rel pour chaque lien. Pour les flux issus de Feedburner, il y a un lien en plus dans ce tableau, avec l'url d'origine de l'article et un rel == origLink. C'est à améliorer pour le rendre plus accessible au frontend, mais c'est là et ça fait bien son boulot.

Dans tous mes flux, ça a l'air d'être le seul problème de vie privée important.

Après, pour choper le flux RSS original, je suis motivé pour le faire, mais je ne sais pas comment trouver l'URL du flux RSS original si elle n'est pas communiquée… :/

eliemichel commented 10 years ago

Ok, la convertion en link rel me semble une bonne idée en effet.

tmos commented 10 years ago

Sinon laissons tomber pour l'instant le flux original ? Tu as déjà fait le plus important (et le plus sûr) pour l'utilisateur final je pense :)

Côté thème on garde l'idée de rendre ça non-obligatoire via une option à l'ajout du flux ? J'ai une jolie switchbox à sortir là :D

eliemichel commented 10 years ago

Il faut que ça soit une option à l'ajout du flux avec possibilité de dire « Retenir ce choix » pour plus être embêté.

tmos commented 10 years ago

Au lieu d'ajouter un «retenir ce choix», je propose de mémoriser l'état du bouton, ainsi dès le chargement de la page, le choix est déjà mis en place de façon transparente, et ça simplifie l'interface :)

eliemichel commented 10 years ago

Ah ouais c'est pas mal non plus !

tmos commented 10 years ago

Et je verrais bien un bouton discret et sobre, dans ce genre : https://d13yacurqjgara.cloudfront.net/users/98470/screenshots/419656/lighted_rocker_switch_v2.jpg (humour :d)

tmos commented 10 years ago

Ça représente bien le «vie privée ON/OFF» non ? :D Bon ok je trouverais plus adapté ;)

eliemichel commented 10 years ago

Comme ça ?

tmos commented 10 years ago

Mais c'est parfait ça, en plus j'ai qu'à prendre l'image, et quand c'est sélectionné, je fait une rotation et puis voilà :D Je vais intégrer ça de ce pas !

eliemichel commented 10 years ago

Don't feed the troll

=P

tmos commented 10 years ago

Ouais t'as raison, bref, j'ai besoin d'un input de type checkbox pour faire mon design :)