g0v / addressbook.parser

Taiwan government addressbook parser
15 stars 3 forks source link

地方議員聯絡資料 #16

Closed juannachen closed 10 years ago

juannachen commented 11 years ago

台北市 http://www.tcc.gov.tw/iFrame.aspx?n=454A3A5A2B5D2DCB

新北市 http://www.ntp.gov.tw/content/contact/contact01.aspx

高雄市 http://www.kcc.gov.tw/PeriodMembers/Contact.aspx

桃園縣 http://www.tycc.gov.tw/page.aspx?wtp=1&wnd=204

基隆市 http://www.kmc.gov.tw/KMCII/councillor_1.aspx

新竹市議會 http://www.hsinchu-cc.gov.tw/

新竹縣議會 http://www.hcc.gov.tw/03councilor/councilor.asp

苗栗縣議會 http://www.mcc.gov.tw/imgtxt_list.php?menu=27&typeid=42&typeid2=665

台中市 http://www.tccc.gov.tw/mobile/unit_2.html

彰化縣議會 http://www.chcc.gov.tw/content/list/list01.aspx

南投縣議會 http://www.ntcc.gov.tw/3_0.html

雲林縣 http://www.ylcc.gov.tw/index.php?inner=member_precinct1

嘉義縣 http://www.cyscc.gov.tw/chinese/Parliamentary_index.aspx?n=29

嘉義市 http://www.cycc.gov.tw/form1/index.asp?m=99&m1=4&m2=15

台南市

Superbil commented 11 years ago

各縣市都各自一個 issue 給人解的好

yagamy4680 commented 11 years ago

今天在練習 Livescript + cheerio (類 jQuery) 的方式爬議會資料, 超方便的.

台中市議會 http://www.tccc.gov.tw/mobile/unit_2.html

程式碼

#!/usr/bin/env lsc
path = process.argv[2]
parse = (html) -> 
    $ = require 'cheerio'
    array = []
    dom = $.load html
    dom 'div[class="style_01"]' .map (i, div) ->
        obj = {}
        div = $ div
        div.children! .filter \p .map (i, p) ->
            p = $ p .text!
            tokens = if -1 == p.indexOf ':' then ['name', p] else p.split ':'
            obj[tokens[0]] = tokens[1]
        array.push obj
    console.log array

if 0 == path.indexOf "http://"
    http = require 'http'
    url = require 'url'
    tokens = url.parse path
    http.request tokens, (response) ->
        html = ""
        response.on 'data', (chunk) -> html += chunk
        response.on 'end', -> parse html
    .end!
else
    fs = require 'fs'
    html = fs.readFileSync path .toString!
    parse html

這樣跑:

./test.ls http://www.tccc.gov.tw/mobile/unit_2.html

這裡是輸出結果:

[ { name: '議長 林士昌',
    '連絡專線': '04-2636-3745',
    '地址': '臺中市龍井區山腳里龍山街258號' },
  { name: '副議長 張宏年',
    '連絡專線': '04-2372-6250',
    '地址': '臺中市五權路2-101號',
    '網址': 'http://www.tccc.gov.tw/changhungnien',
    Email: 'c0110@tccc.gov.tw' },
  { name: 'sc26761616@yahoo.com.tw',
    '連絡專線': '04-2681-6696 / 04-2681-6697',
    '地址': '臺中市大甲區中山路二段1005號',
    '網址': 'http://www.tccc.gov.tw/leelunghong',
    Email: 'c0113@tccc.gov.tw' },
  { name: '第一選區 吳敏濟 ',
    '連絡專線': '04-2688-7139',
    '地址': '臺中市大甲區文武里五福街268號',
    '網址': 'http://www.tccc.gov.tw/wuminchi',
    Email: 'c0125@tccc.gov.tw' },
  { name: '第一選區 楊永昌 ',
    '連絡專線': '04-2688-8359',
    '地址': '臺中市大甲區光明路146號',
    '網址': 'http://www.tccc.gov.tw/yangyungchang',
    Email: 'c0131@tccc.gov.tw' },
  { name: '第二選區 尤碧鈴',
    '連絡專線': '04-2658-2942',
    '地址': '臺中市梧棲區梧棲路119號',
    '網址': 'http://www.tccc.gov.tw/yupiling',
    Email: 'lijhen0130@gmail.com' },
  { name: '第二選區 蘇麗華',
    '連絡專線': '04-2665-1836',
    '地址': '臺中市沙鹿區鹿峰里中山路598號',
    '網址': 'http://www.tccc.gov.tw/sulihua',
    Email: 'c0160@tccc.gov.tw' },
  { name: '第二選區 楊典忠',
    '連絡專線': '04-2623-1616',
    '地址': '臺中市清水區文昌街86號',
    '網址': 'http://www.tccc.gov.tw/yangdianchung',
    Email: 'c0126@tccc.gov.tw' },
  { name: '第二選區 陳詩哲',
    '連絡專線': '04-2662-5337',
    '地址': '臺中市沙鹿區洛泉里中山143之2號',
    '網址': 'http://www.tccc.gov.tw/chenshinche',
    Email: 'c0145@tccc.gov.tw' },
  { name: '第二選區 楊秋雲',
    '連絡專線': '04-2622-2342',
    '地址': '臺中市清水區中華路302號',
    '網址': 'http://www.tccc.gov.tw/web/YangChiuYun',
    Email: 'c0164@tccc.gov.tw' },
  { name: '第三選區 陳世凱',
    '連絡專線': '04-2337-1011',
    '地址': '臺中市烏日區中華路498號',
    '網址': 'http://www.tccc.gov.tw/chenshihkai',
    Email: 'chanskym@yahoo.com.tw' },
  { name: '第三選區 林汝洲',
    '連絡專線': '04-2698-2668',
    '地址': '臺中市大肚區頂街里14鄰榮華街6號',
    '網址': 'http://www.tccc.gov.tw/linruchou',
    Email: 'c0119@tccc.gov.tw' },
  { name: '第三選區 林士昌',
    '連絡專線': '04-2636-3745',
    '地址': '臺中市龍井區山腳里龍山街258號' },
  { name: '第三選區 黃錫嘉',
    '連絡專線': '04-2635-7999',
    '地址': '臺中市龍井區龍泉里3鄰沙田路五段263號',
    '網址': 'http://www.tccc.gov.tw/huanghsichia',
    Email: 'smile5466@gmail.com' },
  { name: 'c0155@tccc.gov.tw',
    '連絡專線': '04-2337-6147',
    '地址': '臺中市烏日區仁德里興祥街30巷7號',
    '網址': 'http://www.tccc.gov.tw/wuchiunghua',
    Email: 'a23370199@yahoo.com.tw' },
  { name: '第四選區 謝志忠',
    '連絡專線': '04-2526-9406',
    '地址': '臺中市豐原區保康路55號',
    '網址': 'http://www.tccc.gov.tw/hsiehchihchung',
    Email: 'greenest999@yahoo.com.tw' },
  { name: '第四選區 陳清龍',
    '連絡專線': '04-2528-6069',
    '地址': '臺中市豐原區豐原大道一段238號',
    '網址': 'http://www.tccc.gov.tw/chenchinglung',
    Email: 'lone.jcky@msa.hinet.net' },
  { name: '第四選區 翁美春',
    '連絡專線': '04-2515-2518',
    '地址': '臺中市豐原區田心里成功路40巷2號',
    '網址': 'http://www.tccc.gov.tw/wongmeichung',
    Email: 'c0135@tccc.gov.tw' },
  { name: '第四選區 陳本添',
    '連絡專線': '04-2557-9519',
    '地址': '臺中市后里區后里里甲后路474號',
    '網址': 'http://www.tccc.gov.tw/chenpentien',
    Email: 'cbt474@yahoo.com.tw' },
  { name: '第四選區 高基讚',
    '連絡專線': '04-2556-6678',
    '地址': '臺中市后里區中合里大圳路295號',
    '網址': 'http://www.tccc.gov.tw/kaojitzan',
    Email: 'kao.service@msa.hinet.net' },
  { name: '第五選區 廖述鎮 ',
    '連絡專線': '04-2567-4339',
    '地址': '臺中市大雅區三和里建興路217號',
    '網址': 'http://www.tccc.gov.tw/liaoshuchen',
    Email: 'olddgo2331@hotmail.com' },
  { name: '第五選區 賴朝國',
    '連絡專線': '04-2539-0566',
    '地址': '臺中市潭子區合作街32號',
    '網址': 'http://www.tccc.gov.tw/laichaokuo',
    Email: 'c0146@tccc.gov.tw' },
  { name: '第五選區 吳顯森',
    '連絡專線': '04-2568-0887',
    '地址': '臺中市大雅區三和里春亭街11號',
    '網址': 'http://www.tccc.gov.tw/wushiansen',
    Email: 'c0161@tccc.gov.tw' },
  { name: '第五選區 許水彬',
    '連絡專線': '04-2566-7020',
    '地址': '臺中市大雅區中清路四段269-6號',
    '網址': 'http://www.tccc.gov.tw/hsushuipin',
    Email: 'sou.chang@msa.hinet.net' },
  { name: '第五選區 蕭隆澤',
    '連絡專線': '04-2531-7772',
    '地址': '臺中市潭子區甘蔗里勝利路211號',
    '網址': 'http://www.tccc.gov.tw/shiaulungche',
    Email: 'a2531.a2531@msa.hinet.net' },
  { name: '第五選區 羅永珍',
    '連絡專線': '04-2527-7147',
    '地址': '臺中市神岡區豐洲里豐洲路638號',
    '網址': 'http://www.tccc.gov.tw/loyungchen',
    Email: 'y.jen88@gmail.com' },
  { name: '第六選區 張廖萬堅',
    '連絡專線': '04-2708-8883',
    '地址': '臺中市西屯區至善路52號',
    '網址': 'http://www.tccc.gov.tw/changliaowanchien',
    Email: 'wanchien0209@gmail.com' },
  { name: 'c0105@tccc.gov.tw',
    '連絡專線': '04-2317-9960',
    '地址': '臺中市惠中路150號',
    '網址': 'http://www.tccc.gov.tw/chenshuhua',
    Email: 'dpp1970@yahoo.com.tw' },
  { name: 'http://www.maxm.com.tw/hsinghwi/',
    '連絡專線': '04-2317-9955',
    '地址': '臺中市西屯區惠來路三段200號',
    '網址': 'http://www.tccc.gov.tw/huanghsinghwi',
    Email: 'c0139@tccc.gov.tw' },
  { name: 'yoyo.yoyo10@msa.hinet.net',
    '連絡專線': '04-2296-0408',
    '地址': '臺中市西屯區大河里皇城街83號',
    '網址': 'http://www.tccc.gov.tw/yangchengchung',
    Email: 'c0115@tccc.gov.tw' },
  { name: '第六選區 張廖乃綸',
    '連絡專線': '04-2313-4757',
    '地址': '���中市西屯區四川路55號',
    '網址': 'http://www.tccc.gov.tw/changliaonailun',
    Email: 'c0133@tccc.gov.tw' },
  { name: '第七選區 劉士州',
    '連絡專線': '04-2386-8878',
    '地址': '臺中市南屯區向心南路959號2樓',
    '網址': 'http://www.tccc.gov.tw/liushihchou',
    Email: 'c0120@tccc.gov.tw' },
  { name: 'http://tw.myblog.yahoo.com/4057-cat',
    '連絡專線': '04-2472-4421',
    '地址': '臺中市大墩七街111號',
    '���址': 'http://www.tccc.gov.tw/changyaochung',
    Email: 'ccm828@yahoo.com.tw' },
  { name: '第七選區 何文海',
    '連絡專線': '04-2475-2091',
    '地址': '臺中市南屯區文心路一段31號',
    '網址': 'http://www.tccc.gov.tw/howenhai',
    Email: 'c0143@tccc.gov.tw' },
  { name: '第七選區 朱暖英',
    '連絡專線': '04-2472-4016',
    '地址': '臺中市南屯區永春東路287號',
    '網址': 'http://www.tccc.gov.tw/junuanying',
    Email: 'c0140@tccc.gov.tw' },
  { name: '第八選區 曾朝榮',
    '連絡專線': '04-2436-2995',
    '地址': '臺中市東山路一段156-6號',
    '網址': 'http://www.tccc.gov.tw/tsengchaojung',
    Email: 'c0149@tccc.gov.tw' },
  { name: 'c0118@tccc.gov.tw',
    '連絡專線': '04-2246-3665',
    '地址': '臺中市松安街178號',
    '網址': 'http://www.tccc.gov.tw/shenyulien',
    Email: 'lotus480928@yahoo.com.tw' },
  { name: 'bingowanga@yahoo.com.tw',
    '連絡專線': '04-2243-3909',
    '地址': '臺中市興安路二段440號',
    '網址': 'http://www.tccc.gov.tw/wangyuehpin',
    Email: 'c0147@tccc.gov.tw' },
  { name: '第八選區 陳成添',
    '連絡專線': '04-2425-6672',
    '地址': '臺中市后庄北路85-1號',
    '網址': 'http://www.tccc.gov.tw/chenchentien',
    Email: 'tien6627@gmail.com' },
  { name: 'alexsjlai@msn.com',
    '連絡專線': '04-2292-8666',
    '地址': '臺中市中清路2之46號',
    '網址': 'http://www.tccc.gov.tw/laishanjen',
    Email: 'c0137@tccc.gov.tw' },
  { name: '第八選區 蔡雅玲',
    '連絡專線': '04-2230-8599',
    '地址': '臺中市北屯區北屯路212巷2號',
    '網址': 'http://www.tccc.gov.tw/tsaiyaling',
    Email: 'greentaiwan@tccc.gov.tw' },
  { name: 'ctw2427@yahoo.com.tw/',
    '連絡專線': '04-2206-7229',
    '地址': '臺中市忠明路448號',
    '網址': 'http://www.tccc.gov.tw/chentienwen',
    Email: 'c0112@tccc.gov.tw' },
  { name: '第九選區 陳有江',
    '連絡專線': '04-2203-0835',
    '地址': '臺中市民權路454號',
    '網址': 'http://www.tccc.gov.tw/chenyouchiang',
    Email: 'c0116@tccc.gov.tw' },
  { name: '第九選區 賴佳微',
    '連絡專線': '04-2293-0119',
    '地址': '臺中市山西路二段210號2樓',
    '網址': 'http://www.tccc.gov.tw/laichiawei',
    Email: 'c0106@tccc.gov.tw' },
  { name: '第十選區 黃國書',
    '連絡專線': '04-2376-8701',
    '地址': '臺中市美村路一段632號B1',
    '網址': 'http://www.tccc.gov.tw/huangkuoshu',
    Email: 'c0152@tccc.gov.tw' },
  { name: '第���選區 張宏年',
    '連絡專線': '04-2372-6250',
    '地址': '臺中市五權路2之94號',
    '網址': 'http://www.tccc.gov.tw/changhungnien',
    Email: 'c0110@tccc.gov.tw' },
  { name: '第十選區 洪嘉鴻',
    '連絡專線': '04-2222-2777',
    '地址': '臺中市西區自由路一段101號 14F-4',
    '網址': 'http://www.tccc.gov.tw/hungchiahung',
    Email: 'c0127@tccc.gov.tw' },
  { name: 'http://www.wretch.cc/blog/phlandlaw',
    '連絡專線': '04-2285-0955',
    '地址': '臺中市南區國光路148號',
    '網址': 'http://www.tccc.gov.tw/linpeihan',
    Email: 'c0134@tccc.gov.tw' },
  { name: 'http://tw.myblog.yahoo.com/ron_chen4243',
    '連絡專線': '04-2282-4639',
    '地址': '臺中市正義街236號',
    '網址': 'http://www.tccc.gov.tw6/chiusuchen',
    Email: 'csc236@gmail.com' },
  { name: 'http://tw.myblog.yahoo.com/mingchenho-mingchenho/article?',
    '連絡專線': '04-2211-9068',
    '地址': '臺中市進化路26之1號',
    '網址': 'http://www.tccc.gov.tw/homingchen',
    Email: 'c0148@tccc.gov.tw' },
  { name: '第十一選區 李中',
    '連絡專線': '04-2213-9077',
    '地址': '臺中市進德路52號',
    '網址': 'http://www.tccc.gov.tw/leechung',
    Email: 'leechung@tccc.gov.tw' },
  { name: '第十二選區 何明杰',
    '連絡專線': '04-2271-2708',
    '地址': '臺中市太平區永隆里光興路579號',
    '網址': 'http://www.tccc.gov.tw/homingchieh',
    Email: 'c0159@tccc.gov.tw' },
  { name: '第十二選區 黃秀珠',
    '連絡專線': '04-2393-7499',
    '地址': '臺中市太平區中山路二段372之3號',
    '網址': 'http://www.tccc.gov.tw/huanghsiuchu',
    Email: 'c0158@tccc.gov.tw' },
  { name: '第十二選區 李麗華',
    '連絡專線': '04-2270-2588',
    '地址': '臺中市太平區太平10街51號',
    '網址': 'http://www.tccc.gov.tw/leelihua',
    Email: 'morearco@yahoo.com.tw' },
  { name: 'http://tw.myblog.yahoo.com/yihuang102',
    '連絡專線': '04-2391-8481',
    '地址': '臺中市太平區育賢路102號',
    '網址': 'http://www.tccc.gov.tw/laiyihuang',
    Email: '6008823@amwaynet.com.tw' },
  { name: '第十三選區 李天生',
    '連絡專線': '04-2482-8819',
    '地址': '臺中市大里區新生西路160號',
    '網址': 'http://www.tccc.gov.tw/leetiensheng',
    Email: 'c0150@tccc.gov.tw' },
  { name: '第十三選區 劉錦和',
    '連絡專線': '04-2493-9907',
    '地址': '臺中市大里區草湖路215巷8號',
    '網址': 'http://www.tccc.gov.tw/liujinho',
    Email: 'c0142@tccc.gov.tw' },
  { name: '第十三選區 江勝雄',
    '連絡專線': '04-2332-2448',
    '地址': '臺中市霧峰區吉峰里吉峰路100之3號',
    '網址': 'http://www.tccc.gov.tw/chiangshenghsiung',
    Email: 'c155355@yahoo.com.tw' },
  { name: '第十三選區 張滄沂',
    '連絡專線': '04-2406-2227',
    '地址': '臺中市大里區大里路422號',
    '網址': 'http://www.tccc.gov.tw/changchuangyi',
    Email: 'c0138@tccc.gov.tw' },
  { name: '第十三選區 段緯宇',
    '連絡專線': '04-2483-7716',
    '地址': '臺中市大里區中興路二段149號',
    '網址': 'http://www.tccc.gov.tw/duanweiyou',
    Email: 'c0162@tccc.gov.tw' },
  { name: '第十四選區 蘇慶雲',
    '連絡專線': '04-2587-7381 / 04-2577-3617',
    '地址': '臺中市東勢區廣興里第四橫街16號',
    '網址': 'http://www.tccc.gov.tw/suchingyun',
    Email: 'su_ching_yun@yahoo.com.tw' },
  { name: '第十四選區 蔡成圭',
    '連絡專線': '04-2582-6305',
    '地址': '臺中市新社區永源里東山街101號',
    '網址': 'http://www.tccc.gov.tw/chaichengguei',
    Email: 'gua5617@xuite.net' },
  { name: '第十五選區 黃仁',
    '連絡專線': '04-2451-0775',
    '地址': '臺中市西屯區環中路二段698號',
    '網址': 'http://www.tccc.gov.tw/huangren',
    Email: 'c0121@tccc.gov.tw' },
  { name: '第十六選區 林榮進',
    '連絡專線': '04-2435-0911',
    '地址': '臺中市北屯區東山路一段216-20號',
    '網址': 'http://www.tccc.gov.tw/linrongjin',
    Email: 'c0122@tccc.gov.tw' } ]
Superbil commented 10 years ago

這麼容易阿,還想用 scrapy 來做一個整合的說

clkao commented 10 years ago

@yagamy4680 張宏年 的選區貓掉了

Superbil commented 10 years ago

台南市 http://www.tncc.gov.tw/tnccp/

高雄市 http://www.kcc.gov.tw/PeriodMembers/Contact.aspx

屏東縣 http://www.ptcc.gov.tw/bexWeb.php?Page=Persional&Guid=1c445ed1-8f2f-4c7f-75f6-6d6aafa3516e

宜蘭縣 http://www.ilcc.gov.tw/H0051.aspx

花蓮縣 http://www.hlcc.gov.tw/councillor.php

台東縣 http://www.taitungcc.gov.tw/ourteam/01ourteam.html

澎湖縣 http://www.phcouncil.gov.tw/mop.php

金門縣 http://www.kmcc.gov.tw/

連江縣 http://www.mtcc.gov.tw/ab_organization.htm

Superbil commented 10 years ago

data.gov.tw 已經有提供清單