Closed ArtemisDicoTiar closed 3 years ago
DB에 저장하려고 했는데 케글에 저장해야겠다.
케글에 저장하려고 했는 데 DB에 해야겠다 ㅋㅋㅋ storyteller도 웹으로 서비스한다고 생각했을떄 Django-Rest로 편하게 구축하려면 DB가 나을 거 같다.
-- | ~idx~ | date | origin | wisdom | definition |
---|---|---|---|---|---|
type | ~BigInt~ | Date | Text | Text | Text |
meaning | ~속담-정의 인덱스~ | 수집된 날짜 | 수집된 사이트 | 속담 | 정의 |
-- | date | origin | eg_id | ~def_idx~ | wisdom | example | example_morph | prev | next | full |
---|---|---|---|---|---|---|---|---|---|---|
type | Date | Text | BigInt | ~BigInt~ | Text | Text | Text | Text | Text | Text |
meaning | 수집된 날짜 | 수집된 사이트 | 고려대 코퍼스에서 사용한 인덱스 번호 | ~속담-정의 인덱스 번호~ | 속담 | 용례 | 용례의 형태소 분석 | 이전 문장 | 다음 문장 | 전체 텍스트 |
인덱스를 설정 안해도 될거 같다. origin이 잡혀있어서 같은 속담이라도 오리진이 다르면 다른 row로 처리될것.
일단! 지금 데이터베이스 핸들러로 만들어 놓은게 오라클 클라우드 디비에 맞춰져 있으니 이것부터 수정해야겠다.
이제 DB 컨트롤러에 데이터프레임 저장시 해당 row 존재 여부 확인 작업을 해야한다.
기존에 수집했던 definition저장 완료. definition은 더이상 수집 할 필요없음.
용례 수집시 속담 정의 수집한 origin을 같이 적어야겠다
용례 수집 완료 (wikiquote)
고려대 1개 속담 용례 수집할때 리스트 사이즈 50고정. 페이지를 변경하면서 가야겠다.
고려대 - wikiquote 약 1만여 용례 수집 완료.
Symbols
"O": Done, "X": Planning not to be done ">": Pending (Still on progress)