arleigh418 / python-and-Taiwan-stock-market

Python 金融市場賺大錢聖經:寫出你的專屬指標
58 stars 19 forks source link

yahoo新聞爬時間問題 #11

Open Jimscwang opened 2 years ago

Jimscwang commented 2 years ago

你好,我知道yahoo新聞顯示格式後來改變了,不過我想試著一樣在第一頁試著學爬時間來看看,但是怎麼爬都只有報導的資訊,沒有時間,但看網頁上span內是有報單資訊跟時間,想請問這部分該怎麼寫,感謝

image

image

arleigh418 commented 2 years ago

Hi 您好,很高興您提問。 您提的是一個非常有深度的問題,我也沒有標準答案。 透過單純的requests的確無法獲取該時間註記,但透過selenium啟動瀏覽器再進行抓取則有。 123

arleigh418 commented 2 years ago

雖說我目前還沒花時間仔細鑽研,但我推測他的n小時、n天前不是透過伺服器請求而來。 可能伺服器回傳的是該篇新聞上傳的時間,然後再透過瀏覽器去運算差了n小時吧。 因此我會建議若是時間不夠研發,短期內有兩樣解決方案:

  1. request爬每篇文章的實際發布時間,配合datetime的now()方法獲取當前時間,再透過日期套件去自行做運算產生資料
  2. 如上透過selenium去load網頁再爬