pycontw / pycon_archive_past_website

Freeze and archive historical PyConTW official websites as static sites.
MIT License
4 stars 7 forks source link

fix(2021): images not display #44

Closed mattwang44 closed 3 months ago

mattwang44 commented 3 months ago

why

發現 2021 網站有有很多圖片都失效,例如所有演講者大頭貼

image

how

發現這些影像的 URL 都是 https://tw.pycon.org/temp/...,這是過去還在開發舊官網 archive 爬蟲程式時幫 2021 網站另外設定的 URL。先將其都改成 https://tw.pycon.org/prs/... 應該可以讓 2021 頁面順利顯示圖片,但這代表爬蟲程式當初沒有順利把所有 images 都給爬下來 archive,需要後續另外處理。(P.S. 2022 以後的網站都是從 GCS 拿圖片,相對安全但還是討論是否依舊存進這個 repo,更加降低維護的心力)

SivanYeh commented 3 months ago

@mattwang44 我先開了Issue避免遺忘. 不過正要部署看看效果時發現"pycon_archive_past_website" 上次git更新是2021年?

mattwang44 commented 3 months ago

@mattwang44 我先開了Issue避免遺忘. 不過正要部署看看效果時發現"pycon_archive_past_website" 上次git更新是2021年?

要看 gh-pages branch,main branch 是爬蟲的 source code

mattwang44 commented 3 months ago

@SivanYeh 我要先 merge 囉?

SivanYeh commented 3 months ago

Go ahead!

mattwang44 commented 3 months ago

發現 2022 也是同樣問題,直接改完推進 gh-pages branch 了 image

mattwang44 commented 3 months ago

目前頁面打開都還是會使用 /temp 上的 images,但 refresh 就會恢復,可能是哪邊 cache 住了,過一陣子再回來檢查

josix commented 3 months ago

這邊其實不是從爬蟲爬的是走 nuxt generate 產生的靜態網站,當初少考慮到 temp server 會關掉 qq

mattwang44 commented 3 months ago

@josix 可以幫忙改一下 ticket description 嗎 🙏🏽 🙏🏽 🙏🏽

SivanYeh commented 3 months ago

有勞兩位了🙏🏻🙏🏻 我這週在搬家. 不是在開車就是在正在開車的路上. 如果除前端外有即時測試需求,可以直接上VM