Open kiang opened 9 years ago
你是用政府資料開放平台上的中藥許可證資料,以健保代碼去串健保署的中藥用藥品項嗎?
我想到資料串不起來的原因有:
你有辦法貼幾個對不起來的例子我看看嗎?
中藥許可證資料是直接把 http://www.mohw.gov.tw/CHT/DOCMAP/query_liense.aspx?mode=1 的資料爬下來, 8578 其實也是連到這個網站,並非像標示一樣有 csv 格式
健保局清單裡面很多錯字,舉例像是下面這些都找不到對應的藥證
"勝昌"山查濃縮散 """順天堂""神?濃縮顆粒" """順天堂""?白濃縮顆粒" """順天堂""胡桃濃縮顆粒" """明通""知母濃縮粉" """明通""黃柏濃縮粉" """明通""薏苡仁濃縮粉" """明通""陳皮濃縮粉" """明通""車前子濃縮粉" "勝昌"芎藭濃縮散 "東陽"白朮濃縮粉 """明通""茯苓濃縮粉" """明通""黃耆濃縮粉" """明通""藕節濃縮粉" """明通""桔梗濃縮粉" """明通""梔子濃縮粉" """明通""大黃濃縮粉" """明通""甘草濃縮粉" """明通""柴胡濃縮粉" """明通""遠志濃縮粉" """明通""黃芩濃縮粉" """明通""牡丹皮濃縮粉" """明通""肉桂濃縮粉" """明通""麻黃濃縮粉" """明通""黃連濃縮粉" """明通""白芍藥濃縮粉" """明通""獨活濃縮粉" """明通""枳殼濃縮粉" """明通""生薑濃縮粉" """明通""防風濃縮粉" """明通""香附濃縮粉" """明通""葛根濃縮粉" """明通""澤瀉濃縮粉" """明通""決明子濃縮粉" """明通""半夏濃縮粉" """明通""白芷濃縮粉" """明通""白朮濃縮粉" """明通""蒼朮濃縮粉" """明通""前胡濃縮粉" """明通""枇杷葉濃縮粉" "勝昌"大棗濃縮粉 "勝昌"鉤藤濃縮粉 "勝昌"濃縮骨碎補粉 "勝昌"濃縮酸棗仁粉 "勝昌"大葉千斤拔濃縮散 "勝昌"濃縮蒼朮粉 "勝昌"濃縮龍眼花粉 "勝昌"濃縮杭菊粉 "勝昌"濃縮五加皮粉 "勝昌"濃縮莪朮粉 "東陽"牛膝濃縮粉 "勝昌"白豆蔻濃縮粉 "勝昌"濃縮檳榔粉 "勝昌"款冬花濃縮粉 "勝昌"栝樓仁濃縮粉 "勝昌"玉竹濃縮粉 "勝昌"何首烏濃縮粉 "勝昌"扁豆濃縮粉 "勝昌"皂刺濃縮粉 "勝昌"桑葉濃縮粉
不過我目前還沒有處理逾期或註銷的藥證,但理論上健保局的清單不應該有這些藥才對
藥證的比對是會將名稱透過符號切割開來進行模糊查詢,像是 """順天堂""蓮子心濃縮顆粒" 會拆成 "順天堂" 與 "蓮子心濃縮顆粒" 然後做交集的模糊查詢(同時也會有部份資料是可以對應到多個藥證,因為名稱容易碰撞)
剛剛確認了,我取得的應該是完整的藥證資料,因為逾期或註銷的藥證看起來都可以在我爬下來的資料中找到。
健保局的資料品質比較差,像是 "勝昌"濃縮五加皮粉 其實應該是 ”勝昌”五加皮濃縮散
嗯,單純用名稱串不起來,可能可以去許願或是回報一下政府開放資料平台那邊的資料品質問題了,若能有健保代碼應該就沒問題。
然後據我的了解,資通正在進行藥證系統的改版,但是何時搞定就不知道,而且中醫藥司內部好像也有一些業務異動。
總之,我建議中藥的資料要獨立切開來處理,讓藥證資料只是額外的附帶資料,原因是不管健保署提供的或是中藥藥證的,其實都只有科學中藥,但其實很多民眾吃的是自己去中藥房抓的。
有丟到 http://data.gov.tw/node/8578 了
現階段要處理的也是跟健保有關的部份,我下載了一些 健康存摺 的範例,如果沒有健保代碼就不能直接跟藥品產生連結。不知道跟健保局許願會不會比中醫藥司快? XD
結果跟健保局許願的結果,還是丟回給中藥司了 XD
依據兩邊的說法,目前並沒有這種對應表存在,只是中藥藥證大多只要將其中的數字抽出來前面加個 A 就是健保代碼
原來有這樣的事情... 我還不知道 XD
年後應該比較會常跑中醫藥司,我再問問看到底是怎麼回事。
在 3f14d0f396abe3f251de3e3901c5b2293005c902 試著把 http://www.nhi.gov.tw/webdata/webdata.aspx?menu=21&menu_id=713&WD_ID=849&webdata_id=932 取得的兩個 xls 檔案轉成 csv 後與現有資料庫進行比對,初步比對發現有很多資料是對不起來的,所以暫時不匯入,可能先問看看相關單位有沒有品質好一點的資料
全民健保健康存摺系統 裡面都是使用健保代號,所以這個對應問題需要處理後才有辦法接著進行 #9 的開發