kyukyunyorituryo / AozoraEpub3

青空文庫テキスト→ePub3変換
http://www18.atwiki.jp/hmdev/
Other
145 stars 14 forks source link

リンク先の大きい挿絵をダウンロードできませんか? #28

Open ArchMuga opened 1 month ago

ArchMuga commented 1 month ago

挿絵ですが、ページに埋め込まれている縮小版でなく、リンク先の大きい挿絵をダウンロードしてepubに変換するようにして頂けないでしょうか?

例えば、

https://novel18.syosetu.com/n6382hq/112/

にある挿絵は、リンク先の

https://img1.mitemin.net/lj/ro/34yn9kk021uvly5s25eeatyq4rhf_1kb_1rk_1d7_frtf.jpg

をepubに取り込んでほしいです。

kyukyunyorituryo commented 1 month ago

narou.rbでは大きい画像取得に対応しているので、narou.rbを使ってみては。

処理の内容としてはページ内の画像からリンク先のページのURLを調べて、リンク先のページ内を解析して画像を取得しなければならない。

ページ内の画像 https://33893.mitemin.net/userpageimage/viewimagebig/icode/i493600/ リンク先のページのURL https://33893.mitemin.net/i493600/

画像小 https://img1.mitemin.net/lj/ro/34yn9kk021uvly5s25eeatyq4rhf_1kb_1rk_1d7_frtf.jpg.580.jpg 画像大 https://img1.mitemin.net/lj/ro/34yn9kk021uvly5s25eeatyq4rhf_1kb_1rk_1d7_frtf.jpg

ArchMuga commented 1 month ago

私の技術力ではちょっとむずかしいです。。。

kyukyunyorituryo commented 1 month ago

試しに大きい挿絵をダウンロードするようにしてみた。 https://github.com/kyukyunyorituryo/AozoraEpub3/actions/runs/11147564026

ArchMuga commented 1 month ago

早速の対応ありがとうございます。 ですが、残念なことにエラーで読み込めません。 メッセージは以下です。


https://novel18.syosetu.com/n6382hq/ を読み込みます キャッシュパスを作成します : D:\AozoraEpub3.cache https://novel18.syosetu.com/n6382hq/一覧ページの取得に失敗しましたhttps://novel18.syosetu.com/n6382hq/ は変換できませんでした

https://novel18.syosetu.com/n6382hq/一覧ページの取得に失敗しました。 を読み込みます https://novel18.syosetu.com/n6382hq/一覧ページの取得に失敗しました。一覧ページの取得に失敗しましたhttps://novel18.syosetu.com/n6382hq/一覧ページの取得に失敗しました。 は変換できませんでした

https://novel18.syosetu.com/n6382hq/ を読み込みます https://novel18.syosetu.com/n6382hq/一覧ページの取得に失敗しましたhttps://novel18.syosetu.com/n6382hq/ は変換できませんでした

kyukyunyorituryo commented 1 month ago

UAの設定方法をGUI上に変更したので、GUI上のwebタブからUAを設定をChromeにするといい。

ArchMuga commented 1 month ago

素晴らしい。 無事に大きな画像でepubとなりました。 本当にありがとうございました。

kyukyunyorituryo commented 1 month ago

v1.1.1b28Qではwebタブの「画像大」のチェックボックスで切り替えができる。 https://github.com/kyukyunyorituryo/AozoraEpub3/releases/tag/v1.1.1b28Q