datagouv / data.gouv.fr

Ce dépôt rassemble les tickets techniques qui portent sur data.gouv.fr.
https://www.data.gouv.fr
76 stars 14 forks source link

Problème des ressources distantes sur Safari #836

Open agarrone opened 2 years ago

agarrone commented 2 years ago

Sur Safari lorsqu'on clique sur l'icône télécharger et que la ressource est en fait un lien data.gouv.fr télécharge le html de la page plutôt de rediriger vers le lien.
Exemple de jdd https://www.data.gouv.fr/fr/datasets/admin-express/

nicolaskempf57 commented 2 years ago

Comme la ressource n'est pas une URL (le format est html dans l'exemple et non url), elle est traitée comme un fichier à télécharger. Nous indiquons donc explicitement aux navigateurs de télécharger le fichier plutôt que d'essayer de l'ouvrir. Comme c'est un cas un peu particulier (on demande de télécharger un fichier HTML), tous les navigateurs n'ont pas le même comportement.

Si l'on veut changer ça de notre côté, on peut soit considérer que les fichiers HTML sont en réalité des liens (ce qui n'est pas vraiment vrai), soit supprimer l'indication de téléchargement, mais cela affectera tous les fichiers.

Le plus propre serait que la ressource soit indiquée comme une url et non un fichier HTML.

maudetes commented 2 years ago

Je me demande comment c'était traité sur legacy, et si le problème existait déjà ou non.

nicolaskempf57 commented 2 years ago

C'était déjà présent de la même façon avant udata-gouvfr : https://github.com/etalab/udata-gouvfr/commit/41ca612d8b2bd1c9bf94413739360ab46330fa8f#diff-ab73381d8d1c0505d741989fb31441caa1cfa6e5a98d870d72ea08fdc876027cR59 Et c'est géré par Safari depuis le 27/03/2017

restuccia commented 2 years ago

AMHA le plus propre serait d'empêcher aux producteurs de mettre des liens où on s'attend à des fichiers…

agarrone commented 1 year ago

Avec Hydra, plus facile de detecter que le retour est de html.

agarrone commented 5 months ago

@maudetes Est-ce qu'on veut investiguer ce pb de nouveau ?

nicolaskempf57 commented 5 months ago

Avec Hydra, plus facile de detecter que le retour est de html.

Le problème est qu'on ne peut pas savoir à la place de l'utilisateur s'il veut qu'on propose son fichier HTML en téléchargement (ex: un fichier de démonstration, une documentation) ou bien qu'on ouvre une vraie page de son site.

On peut choisir arbitrairement de faire l'un ou l'autre pour un fichier distant vs hébergé sur data.gouv, mais ce sera forcément arbitraire si le producteur ne le fait pas correctement lui-même.

maudetes commented 5 months ago

D'accord avec Nicolas sur le fait qu'il faudrait dans l'idéal qu'on distingue entre un lien vers une page de son site VS un fichier HTML en téléchargement (aujourd'hui fait de manière cachée via le format url) et qui pourrait être indiquée de manière claire dans le parcours de publication.

Par contre, on peut aussi se dire qu'on est plutôt sur un lien qu'un download par défaut si le format est html ? C'est le comportement majoritaire des navigateurs, et je ne suis pas sûre que ça ait jamais été une plainte ? En regardant des exemples de ressources renseignées au format html, j'ai l'impression que c'est très souvent des pages d'un site pas un fichier HTML en téléchargement.

Un avis @agarrone ?

agarrone commented 4 months ago

Je suis pour considérer par défaut un fichier html comme un lien. 🙂

C'est vrai qu'aujourd'hui sur le parcours on a fichier et lien distant mais dans lien distant on insiste sur le fait que ça soit un fichier même si après on le traite comme un lien.

image