CAFECA-IO / Political-Donations-Crawler

MIT License
0 stars 0 forks source link

爬取113年總統副總統選舉政治獻金資料庫 csv 檔案 #1

Closed gibbs-shih closed 2 weeks ago

gibbs-shih commented 2 weeks ago

爬取113年總統副總統選舉政治獻金資料庫 csv 檔案

gibbs-shih commented 2 weeks ago
gibbs-shih commented 2 weeks ago

從 HTML 內容來看,網頁的主要內容是通過 JavaScript 動態加載的 意味著在初始的 HTML 中並沒有要查找的關鍵字或內容 使用像 axios 和 cheerio 這樣的工具無法獲取動態加載的內容

💡 使用像 Puppeteer 這樣的工具來模擬一個完整的瀏覽器環境,可以執行 JavaScript 並獲取動態加載的內容 npm install puppeteer

gibbs-shih commented 2 weeks ago

執行指令 npm start

CleanShot 2024-09-03 at 17 30 17

CleanShot 2024-09-03 at 16 39 46

CleanShot 2024-09-03 at 16 49 14

gibbs-shih commented 2 weeks ago

建立sql lite 資料庫, 使用prisma npm install sqlite3 npm install prisma --save-dev

初始化 npx prisma init

完成schema格式

CleanShot 2024-09-03 at 17 20 11

生成 prisma client npx prisma generate

使用 prisma 遷移功能來建立資料庫及資料表 npx prisma migrate dev --name init

CleanShot 2024-09-03 at 17 21 52

gibbs-shih commented 2 weeks ago

使用以下兩個資料, 解析存入資料庫 #2

gibbs-shih commented 2 weeks ago

take 8 hr