JohnsonHsieh / ecfa

5 stars 6 forks source link

爬 ptt 文章時 getURL遇到的問題 #1

Open rz12345 opened 9 years ago

rz12345 commented 9 years ago

Hi Johnson 我是目前正在學習 text mining & R 語言的新手,最近拜讀到 text mining 的資訊,因此找到了這邊,實作中爬 web 版 ptt 文章目前會有自動導向到 https 的情況

當: StupidClown <- 'https://www.ptt.cc/bbs/StupidClown/index.html' getURL(StupidClown)

會遇到 ssl 憑證的問題,目前試出於 getURL 中加上 ssl.verifypeer = FALSE 之後就會正常 work了

如下: getURL(StupidClown ,ssl.verifypeer = FALSE) 提供參考@@

JohnsonHsieh commented 9 years ago

Thx for your kindly feedback