Closed TzuHanLiang closed 3 months ago
資料來源分析
爬蟲基本結構搭建
爬取議案列表
詳細議案資料抓取
數據清洗與處理
影片下載功能
音頻轉換
逐字稿生成工具選擇
逐字稿生成
逐字稿校正與格式化
摘要生成模型訓練
摘要生成接口開發
摘要生成測試
摘要優化
生成摘要展示
評分算法開發
數據整合
決策模型訓練
決策結果展示
系統整合與測試
數據整理與篩選
報告內容自動生成
報告格式化
圖表生成
報告輸出功能
報告審核與校對
報告發布系統
用戶反饋機制
這些任務總共需要46小時,並分成13個小任務。
took 2.5hr done
附註: KM #153 目標調整
鄉民玩 AI:EP1 立法院十大好球系統概述
這套系統利用人工智慧技術篩選和展示台灣立法院每日最重要的十個議題,旨在讓公眾輕鬆掌握立法院的運作情況,提供簡潔且易於理解的重點資訊。使用者可以快速了解立法院內最值得關注的議題,增加公眾對立法過程的興趣與參與,提升政治透明度,並促進民主監督。
系統背景
台灣立法院提供了豐富的公開資料,包括:
這些資料雖然全面,但由於其龐大的資料量,公眾很難即時、客觀、準確地獲取和理解所有資訊。為了有效處理這些資料,AI 技術的應用成為必要。AI 可以自動篩選並分析大量資料,確保資訊的即時性和準確性,並提供客觀的分析結果,幫助公眾快速掌握重要資訊。
系統運作
這套系統分為五大部分:
1. 議案分錄爬蟲系統 SmartLegiCrawler
負責爬取立法院的各項議案、會議記錄和相關資料,確保數據的即時更新。透過自動化技術,該系統能夠高效地蒐集大量數據,為後續的分析提供基礎。
2. 影片逐字稿系統
對立法院會議錄影進行逐字稿轉換,將音頻數據轉換為文字,確保每一個發言都能被精確記錄。這部分系統運用語音識別技術,提高轉錄的準確性和效率。
3. 生成式議事摘要系統 GenAI ProceedingsSummarizer
利用生成式AI技術,對逐字稿進行摘要,提取出關鍵內容。該系統根據語義分析和自然語言處理技術,自動生成簡潔且富有信息量的摘要,幫助公眾快速了解議事重點。
4. 智慧量化決策系統 SmartQuantDecider
對議案進行量化評價,根據多項指標(如議案的重要性、影響範圍、相關議員的發言情況等)進行評分。該系統運用數據分析和機器學習技術,對每個議案進行客觀評估,確保分析結果的準確性和可靠性。
5. 生成立法院十大好球報告
綜合前述系統生成的數據和分析結果,該系統每日自動生成立法院十大好球報告,向公眾展示最值得關注的十個議題。報告內容簡潔明了,富有洞見,幫助使用者快速掌握立法院的重要議題。
系統優勢
這套系統的應用,將有助於提升台灣立法院運作的透明度,促進公眾參與和民主監督。
此 issue 目標