Open Phyks opened 10 years ago
Attention, le plugin de Leed rend certains flux inutilisables…
Faudrait un truc à la NoScript, où on autorise au cas par cas si on veut. Et faut faire gaffe à ne pas frustrer les utilisateurs non avancés : ne pas activer par défaut tout ce qui est susceptible de vraiment casser un flux pas si mauvais que ça.
Clairement, ça ne doit pas casser quoi que ce soit.
Phyks
On 18 juillet 2014 13:25:19 UTC+02:00, Elie Michel notifications@github.com wrote:
Faudrait un truc à la NoScript, où on autorise au cas par cas si on veut. Et faut faire gaffe à ne pas frustrer les utilisateurs non avancés : ne pas activer par défaut tout ce qui est susceptible de vraiment casser un flux pas si mauvais que ça.
Reply to this email directly or view it on GitHub: https://github.com/Phyks/Freeder/issues/10#issuecomment-49420782
Pour feedburned, ça pourrait être sympa de récupérer le lien vers le flux rss d'origine dès l'ajout, on proposerait un «souhaitez vous utiliser le flux original ? Cela respecte mieux votre vie privée, mais peut parfois mal fonctionner». Ou alors un plus général : «Souhaitez vous que Freeder modifie ce flux afin de protéger votre vie privée ? Cela peut parfois engendrer des comportements étranges. Plus d'infos ici (lien vers une page du site où on explique pourquoi feedburner c'est mal, comment on anonymise, etc). Zen pensez quoi ?
Je suis assez pour, mais faut faire attention à comment tourner la phrase :
[Avancé]
Peut-être donner une info sur le type de risque détecter au moment de poser la question ? Faut voir ce qui est techniquement faisable. S'il y a plusieurs risques distincts (Ex : script JavaScript douteux d'un côté et CDN blacklisté — j'invente à la volée, je sais pas si c'est ça qu'on veut bloquer) proposer une option pour chacun.Certes, mais aujourd'hui le script de filtrage de Leed pose quand même des problèmes sur certains sites, et il ne faut pas se le cacher, donc autant avertir clairement l'utilisateur que ça peut foirer, auquel cas il suffit de le désactiver pour le site. +1 pour le «c'est la faute du flux qui ne respecte pas votre vie privée» par contre !
On pourrait même faire la vérification de notre côté pour voir si ça marche non ? Par exemple afficher le dernier article du flux feedburner et le dernier article du flux traité, et demander «est-ĉe que c'est ok ?» si oui, c'est bon, si non, ça laisse le feedburner et ça nous remonte l'info !
Ça peut être intéressant de partager ces infos, genre avoir une petite base de donnée des flux qui marchent en appliquant tel ou tel filtre.
Oui, mais faudrait pas faire ça de façon trop formelle je pense : ce sont des données très temporelles (le jour où feedburner est stopé, plus rien n'est vraiment valable). Et hormis Leed (et encore, juste le mainteneur de l'extension), ça ne concerne pas 12 000 personnes… Mais je pense que ça reste une bonnée idée de partager ça d'une façon un peu plus lisible qu'en vrac au milieu d'un fichier php ;)
T'as raison, de façon général tout ce qui relève de la centralisation ne doit pas être complètement officiel. Ça doit être là à titre indicatif puisque ça repose sur le bon vouloir des éventuels utilisateurs et que même si c'est « crowd reviewed » rien n'empêche que quelqu'un s'amuse à tout casser.
En fait faut prévoir de pouvoir partager cette info entre plusieurs instances de Freeder, sans nécessairement que ce soit à grande échelle. (J'aime le côté social de la chose =D)
Tu as raison, a mon avis le plus simple est que ça remonte chez nous, on traite et on déploie ensuite aux instances via les majs :)
On 18 juillet 2014 14:58:05 CEST, Elie Michel notifications@github.com wrote:
T'as raison, de façon général tout ce qui relève de la centralisation ne doit pas être complètement officiel. Ça doit être là à titre indicatif puisque ça repose sur le bon vouloir des éventuels utilisateurs et que même si c'est « crowd reviewed » rien n'empêche que quelqu'un s'amuse à tout casser.
En fait faut prévoir de pouvoir partager cette info entre plusieurs instances de Freeder, sans nécessairement que ce soit à grande échelle. (J'aime le côté social de la chose =D)
Reply to this email directly or view it on GitHub: https://github.com/Phyks/Freeder/issues/10#issuecomment-49427522
Mmh je sais pas si on s'est compris. J'ai parlé de ne pas centraliser justement. ^^
Donc tu veux faire communiquer les instances entre-elles ?
Pour finir, ça n'ajoute absolument rien de «social», les utilisateurs ne verrons pas d'amélioration à leur échelle. Et même à petite échelle (aka deux installations sur le même serveur), ça va être un bordel monstre.
Selon moi, à partir du moment où on à besoin d'une intervention des devs sur ces infos, ça doit repasser par la case départ, donc autant propager ça avec les updates régulières : par exemple la prise en charge d'un nouveau site pour l'anonymisation entrainera une notif : «vous avez N nouveaux flux qui peuvent être améliorés !».
Wow. Je disais juste ça en pensant aller dans ton sens mais c'est sûr que t'as raison. Je pensais pas vraiment à un truc automatique, je voulais juste dire qu'on ne pouvait pas dire « Ça, la team a vérifié, c'est sûr c'est bon. » et que donc ce genre de pseudo-assurance devrait se faire à plus petite échelle, au sein d'un groupe de personnes qui se font confiance.
Pour le « Social » c'était une joke. =P Même si lorsqu'on voudra ajouter un plugin Social les instances se mettrons nécessairement à communiquer.
xD ok je me suis un peu excité pour rien là faut croire, mes plus plates excuses ! Je pense que la fonction d'amélioration de la vue privée est quand même à considérer avec attention : c'est une très bonne chose, mais le traitement des flux reste du cas par cas, du coup je vois mal comment se passer du regard des devs sur la chose.
Voilà, encore désolé, on s'est mal compris, j'ai cru voir un clone de diaspora arriver à l'horizon, j'ai pris peur :D
Wow, grosse discussion… Pile quand je suis occupé =(
@tmos, tu aurais un exemple de flux cassé stp ?
Hélas non… Une des personnes pour qui j'héberge un Leed avait ralé, et je m'étais empressé de désactiver l'extension, rien de plus … :/
Si on résume :
xtor
, utm_
and co).Pour 3, l'URL ne fonctionne pas de base, car c'est pas une URL. Donc on prend pas grand risque à la casser un peu plus :)
Pour 2, Faut faire ça proprement.
Pour 1, on cherche un lien RSS qui matche, si on trouve pas (ou s'il n'y a aucun flux), ça veut dire qu'il y a un problème et on ajoute feedburner, comme ça on casse rien.
EDIT: After a quick check, 1. seems very unlikely… Most of the sites using feedburne / feedpress that I saw are running Wordpress and the Wordpress plugin is automatically redirecting to these services so that the original link does not exist anymore… =(
Pour 2., l'utilisation du champ <link rel="self" />
des flux n'est-il pas une solution ? Les paramètres de tracking ne devraient pas y être.
+1 pour le self
, et il me semble aussi que Feedburner garde l'url du flux d'origine dans le code…
Pas compris le 3 par contre :|
Pas compris le 3 non plus d'ailleurs…
Ok, prenons un flux pour démo : http://feeds.feedburner.com/TheHackersNews?format=xml
Le self
est remplacé par le lien feedburner (de toutes façons, même s'ils laissaient le lien du flux WordPress d'origine, celui-ci retourne un 301 Moved Permanently
vers Feedburner.
Le lien des articles est http://feedproxy.google.com/~r/TheHackersNews/~3/ydssKpv75-s/new-variant-of-havex-malware-scans-for.html (beuuuuuuuuuurk). Mais feedburner conserve en effet le lien d'origine dans un tag à lui (quand on peut faire simple…):
<feedburner:origLink>http://thehackernews.com/2014/07/new-variant-of-havex-malware-scans-for.html</feedburner:origLink>
(Au passage, pourquoi faire une extension de noms avec feedburner:
quand on pourrait le faire avec la spec de base avec un rel=alternate
ou un truc du genre ?!)
Enfin, le guid est tag:blogger.com,1999:blog-4802841478634147276.post-6952629369817198993
et je crois que Leed l'utilise pour le lien du titre, donc les articles ne sont pas cliquables… Mais je crois qu'osef nous en fait, car il suffit de parser le flux proprement.
Feedpress par contre est plus cool, et il n'y a rien à faire avec eux : http://feedpress.me/blogapart
J'ai pas de flux avec des paramètres de tracking en stock. Si vous en avez, faîtes circuler, sinon je repousse l'implémentation.
Si les gens veulent utiliser feedburner y a pas de raison de les en empêcher. C'est un problème de vie privée pour l'emmetteur du flux, pas le lecteur.
Quand quelqu'un utilise feedburner, c'est pour éviter que tout le monde fasse ses requêtes directement sur son site et le fasse sauter (même si c'est plus ou moins légitime et parfaitement inutile lorsque couplé à l'utilisation de plateformes anti-DDoS comme CloudFlare) donc ça me semble pas une bonne idée de dire « Je m'en fiche, je vais quand même lire à la source. »
Personnellement ce n'est pas tant la source de récupération de l'article qui me choque (enfin si, mais bon c'est un choix de l'admin comme le dit Élie…). C'est surtout le lien sur la balise de titre.
Exemple :
L'idéal étant selon moi de checker si l'adresse du flux original marche, si oui, la récupérer (mais là ça peut foirer ou même aller à l'encontre du choix de l'admin comme le dit Élie, il faut donc bien réfléchir), mais surtout, de changer le lien à rallonge de Feedburner (cf ci-dessus) par un lien potable.
Il faut concilier tout ça avec le fait que déléguer ses flux RSS peut avoir une réelle utilité, comme le dit Élie.
Ah oui par contre les liens comme ça on peut les filtrer. Après Korben a peut-être envie qu'on mette ça pour qu'il fasse ses petites stats…
En tant qu'utilisateur, c'est à moi de choisir ce que j'accepte de donner, ce n'est pas au webmaster de décider ce qu'il prend. Je peux tout à fait choisir d'utiliser son lien feedburner ou le lien de base. C'est mon choix de vouloir ou non donner toutes ces infos. Piwik par exemple (tracking open source) permet aux utilisateurs de choisir de ne pas êtres suivis via un cookie.
Cette option ne sera pas obligatoire, donc si je veux aider Korben [et google] dans ses stats, libre à moi de ne pas anonymiser le lien.
Selon moi, c'est à l'utilisateur de choisir si oui ou non, il souhaite donner ses infos. Et donner ce choix via un simple bouton, c'est peut être le premier pas vers un questionnement de la part des «non concernés».
(PS: après relecture je trouve que ce dernier post à de la gueule, je vais peut être en faire un article :D)
@tmos: sur le flux de Korben, il y a ce genre de tags:
<feedburner:origLink>http://korben.info/bernard-cazeneuve.html</feedburner:origLink></item>
comme sur celui que j'avais linké plus haut. Je vais parser ce tag en plus, et on devrait dégager les merdes de proxy de feedburner.
Virer les paramètres en plus, _utm and co, normalement il ne devrait pas y en avoir dans les liens des flux du coup (puisque c'est des trucs Google, rajoutés par Feedburner, et que ça n'apparaît pas dans le origLink).
Et après, pour récupérer l'URL de la source, c'est pas si évident en fait… Certains comme Korben ont encore le flux de base fonctionnel, mais la plupart redirige de façon transparente vers Feedburner. Et trouver l'URL de base du flux, c'est pas évident (pour un wordpress, c'est censé être /feed
, mais dans le cas général, je ne sais pas…).
Fait gaffe à pas patcher le parseur RSS de base trop violemment. Il faut pouvoir discerner ce qui est le standard de ce qui concerne ce genre d'optimisation.
Ouais, t'inquiète :)
C'est déjà pas mal du tout d'avoir un lien propre :) Mais même ça doit être inclu dans l'option «forcer le respect de la vie privée». [edit: ah ben oui, tout le monde à l'air d'accord là dessus :)]
Dans l'ordre selon moi :
Ok, dans le dernier commit j'ai ajouté ce dont je parlais.
Dans le parser, je regarde si je trouve un tag origLink
dans le NS feedburner
. Si oui, je l'ajoute à la liste des liens, avec un rel=origLink
.
En résumé, $entry['links']
est un tableau de liens, contenant url
, title
et rel
pour chaque lien. Pour les flux issus de Feedburner, il y a un lien en plus dans ce tableau, avec l'url d'origine de l'article et un rel == origLink
. C'est à améliorer pour le rendre plus accessible au frontend, mais c'est là et ça fait bien son boulot.
Dans tous mes flux, ça a l'air d'être le seul problème de vie privée important.
Après, pour choper le flux RSS original, je suis motivé pour le faire, mais je ne sais pas comment trouver l'URL du flux RSS original si elle n'est pas communiquée… :/
Ok, la convertion en link rel me semble une bonne idée en effet.
Sinon laissons tomber pour l'instant le flux original ? Tu as déjà fait le plus important (et le plus sûr) pour l'utilisateur final je pense :)
Côté thème on garde l'idée de rendre ça non-obligatoire via une option à l'ajout du flux ? J'ai une jolie switchbox à sortir là :D
Il faut que ça soit une option à l'ajout du flux avec possibilité de dire « Retenir ce choix » pour plus être embêté.
Au lieu d'ajouter un «retenir ce choix», je propose de mémoriser l'état du bouton, ainsi dès le chargement de la page, le choix est déjà mis en place de façon transparente, et ça simplifie l'interface :)
Ah ouais c'est pas mal non plus !
Et je verrais bien un bouton discret et sobre, dans ce genre : https://d13yacurqjgara.cloudfront.net/users/98470/screenshots/419656/lighted_rocker_switch_v2.jpg (humour :d)
Ça représente bien le «vie privée ON/OFF» non ? :D Bon ok je trouverais plus adapté ;)
Comme ça ?
Mais c'est parfait ça, en plus j'ai qu'à prendre l'image, et quand c'est sélectionné, je fait une rotation et puis voilà :D Je vais intégrer ça de ce pas !
Don't feed the troll
=P
Ouais t'as raison, bref, j'ai besoin d'un input de type checkbox pour faire mon design :)
Salut,
Je voulais virer les redirections et autres trackers pourris dans les flux.
Je connais déjà ceci https://github.com/ldleman/Leed-market/blob/master/urlclean/urlclean.plugin.disabled.php qui va en traiter certains, mais je ne suis pas certain qu'il traite tout.
Donc si vous avez des flux avec de tels problèmes, listez-les :)