SthephanShinkufag / Dollchan-Extension-Tools

The best way to browse imageboards
https://dollchan.net/extension/
MIT License
368 stars 67 forks source link

[Bug] downloading a thread from desuarchive creates an archive that some Linux tools consider broken / при скачивании треда с desuarchive нет .html #1497

Open aleksejrs opened 2 months ago

aleksejrs commented 2 months ago
  1. При скачивании треда в архиве отсутствует .html с постами.
  2. На desuarchive. В архивах с 4chan .html есть.

Firefox:

Empty string passed to getElementById(). 3 jquery.min.js:2:7681 Content-Security-Policy: The page’s settings blocked the loading of a resource (img-src) at data:image/gif;base64,R0lGODlhEAAQAKIAAP… because it violates the following directive: “img-src 'self' https://desuarchive.org https://desu-usergeneratedcontent.xyz https://www.gravatar.com” 2 Dollchan_Extension_Tools.es6.user.js:6016:50 TypeError: input is null 6 Dollchan_Extension_Tools.es6.user.js:2257:20 Empty string passed to getElementById(). 3 jquery.min.js:2:7681 Cookie warnings 2

Tor Browser:

Empty string passed to getElementById(). 3 jquery.min.js:2:7680 Content-Security-Policy: The page’s settings blocked the loading of a resource at data:image/gif;base64,R0lGODlhEAAQAKIAAP… (“img-src”). 2 Dollchan_Extension_Tools.es6.user.js:6016:49 Some cookies are misusing the recommended “SameSite“ attribute 4 Empty string passed to getElementById(). 3 jquery.min.js:2:7680

Описание браузера и Dollchan

  1. Firefox 129.0.2 (64-bit) или Tor Browser 13.5.2 (based on Mozilla Firefox 115.14.0esr)
  2. Dollchan v23.9.18.0
  3. расширение

Шаги для воспроизведения поведения ошибки

  1. Перейти к https://desuarchive.org/g/thread/101503511#101503571
  2. Нажать «Download thread»
  3. Скачивается архив с каталогом data/ и, если удалось скачать, images/ и thumbs/, но без .html-файла.
SthephanShinkufag commented 2 months ago

Firefox 130.0 (64-bit) с расширением v23.9.18.0 - скачал несколько тредов с разных досок, треды скачиваются нормально. Скрипт с гризманки тоже работает.

TypeError: input is null 6 Dollchan_Extension_Tools.es6.user.js:2257:20

В консоли ваша ошибка указывает, что какой-то контент не удаётся добавить в архив, но причину выяснить не могу. У меня этой ошибки нет, нужно добиться её самому.

aleksejrs commented 2 months ago

Похоже, всё скачивается, но tar файлы именно с desuarchive повреждены, и не всё может их распаковать.

При их монтировании с помощью archivemount отображается не всё. В архивах прямо с 4chan файл отображается.

Debian

$ archivemount  --version 
archivemount version 1-1
libarchive 3.7.4 zlib/1.3.1 liblzma/5.6.2 bz2lib/1.0.8 liblz4/1.9.4 libzstd/1.5.6 (header 3.7.4)
FUSE library version 3.14.0
using FUSE kernel interface version 7.31
fusermount3 version: 3.14.0

aunpack показывает после html-файла ошибку, но файл цел:

tar: Exiting with failure status due to previous errors
aunpack: tar ...: non-zero return-code
SthephanShinkufag commented 2 months ago

скачал несколько тредов с разных досок

Неправильно выразился. С разных досок на desuarchive, например https://desuarchive.org/a/ или https://desuarchive.org/g/ Я виндоюзер, 7zip всё распаковывает, там есть тестирование, ошибок не находит. Похоже, 7zip более дубовый и ему пофиг, а линупсовым утилитам видимо что-то не нравится.

aleksejrs commented 2 months ago

Да, для 7-Zip 24.08 всё нормально.