joeunins / bxr_plover

Blue X-ray Plover
MIT License
5 stars 3 forks source link

MsOffice, hwp 문서 등의 내용을 txt로 추출 가능한 필터 개발 #18

Open jun08111 opened 5 years ago

jun08111 commented 5 years ago

hwp문서, docx문서의 내용을 txt로 추출하는 라이브러리 찾음. (hwp문서 라이브러리는 개발자분에게 사용가능여부 물어봐야함.)

joeunins commented 5 years ago

사용 가능하면 각 문서들을 txt로 읽어들이는 부분을 함수로 만들어서 붙여야함