g0v / twangry

政誌 - Angry event made in Taiwan.
http://fact.g0v.tw
Do What The F*ck You Want To Public License
51 stars 25 forks source link

跨wiki page parse #34

Closed jimyhuang closed 11 years ago

jimyhuang commented 11 years ago

在同一個事件,wiki通常會拆分為不同條目,若能為單一事件進行跨page的蒐集,應該會更完整呈現事件樣貌。

pm5 commented 11 years ago

有沒有例子可以參考 and 測試?

jimyhuang commented 11 years ago

洪仲丘: http://zh.wikipedia.org/zh-tw/%E6%B4%AA%E4%BB%B2%E4%B8%98%E4%BA%8B%E4%BB%B6 http://zh.wikipedia.org/wiki/%E7%99%BD%E8%A1%AB%E8%BB%8D%E9%81%8B%E5%8B%95 http://zh.wikipedia.org/wiki/%E5%85%AC%E6%B0%911985%E8%A1%8C%E5%8B%95%E8%81%AF%E7%9B%9F

  1. 可能的url parse 方式為 http://angry.g0v.tw/wiki/洪仲丘事件+白衫軍運動+公民1985行動聯盟
  2. 剛好有用async,可在這裡加上parallel的fetch https://github.com/g0v/twangry/blob/master/lib/route.js#L99
pm5 commented 11 years ago

應該是可以. 這又跟 routing 有關係... 我改完 routing 來改這個好了.

pm5 commented 11 years ago

看不出來要怎麼即時從多則 wiki page 合併出來的 JSON 然後 stream 給 timeline.js... = =a

pm5 commented 11 years ago

啊. 用 http://fact.g0v.tw/wiki/洪仲丘事件+白衫軍運動+公民1985行動聯盟.json.

pm5 commented 11 years ago

開了一個 dev-multievent branch, 可以吃 http://fact.g0v.tw/wiki/洪仲丘事件+白衫軍運動+公民1985行動聯盟.jsonhttp://fact.g0v.tw/wiki/洪仲丘事件+白衫軍運動+公民1985行動聯盟 這類的 query. 不過有些小地方跟 #49 有關, 像是: 事件頁的標題, 首頁連到事件頁的連結等等. 而且好像還會在 cache dir 丟一些髒髒的 json 檔 XD

Anyway 等 #49 有個結論以後再來繼續修.

jimyhuang commented 11 years ago

髒髒的!!感覺得拿穩潔出來~

pm5 commented 11 years ago

另外開了一個 dev-oo 是把 timeline 和 wiki 改成 object-oriented 寫法.

pm5 commented 11 years ago

介面的部份拉到 #57 處理.

pm5 commented 11 years ago

好像把髒髒的 json 檔案修掉了... 那就先關掉 issue. 剩下的部份連同 Google Doc 格式一併移到 #57.