D2CampusFest / 3rd

27 stars 4 forks source link

[performace-navigator] 데이터 파싱 분석 #31

Open jisung0178 opened 8 years ago

jisung0178 commented 8 years ago

안녕하세요 ! 팀원이 전부 알바몬들이라 온라인에서 먼저 인사를 드리게 되었네요 ~ 반갑습니다! 저희 프로젝트는 공연이 끝난후 사람들의 택시 수요가 증가하는것에 반해 택시 공급이 원활하게 되지 않아 어려움을 겪는다는 문제점을 착안하여 택시기사분들께 공연이 끝나는 시간을 제공하는 프로그램입니다. 따라서 가장 중요한 부분이 공연이 끝나는 시간인데요. 공연정보들을 크롤링해와서 시작시간 + 소요시간으로 끝나는 시간을 제공합니다. 그런데 이때 시작시간에 대한 정보들이 오후 3시 이런식으로 딱딱 되어있지 않고 2016년2월5일(금) 6시에 시작합니다/평일 오후3시,5시/공휴일은 쉽니다/ 처럼 패턴이 정해져있지 않아서 가장 애를 먹는 부분입니다. 일단은 어떻게든 예외처리를 하여서 위의 문구같은 경우 예외처리를 하면 ' 평일 3 5 공휴일 ' 까지 나오게 했습니다. 그래서 요일이름 뒤 나오는 첫번째 숫자를 시작시간으로 했는데요. 이렇게 하니 하루에 여러개하는 공연시간을 알수없고 특정요일문구를 다 지워버려서 특정날에 잘못된 정보를 주게 됩니다. 어떻게 데이터를 파싱하여 처리할지 의견을 들어보고 싶습니다~

Kang-heesuk commented 8 years ago

@jisung0178 안녕하세요 반갑습니다. 내일 두 번째 밋업이 진행되는데요, 참석 가능하시면 #28 에 댓글로 남겨주세요! 함께 이슈에 대해 토론 해보면 좋을 것 같습니다 :)

maxtortime commented 8 years ago

물론 써보셨겠지만 요즘 GMail이나 OSX 내장된 메일 앱만 봐도 이메일에 Schedule 같은게 있는 것 같으면 알아서 캘린더에 등록해주는 기능이 있습니다. 그리고 GMail은 한술 더떠서 메일을 알아서 분석해놓고는 적절한 답을 보낼 수 있게 해주기도 하죠. (물론 아직 많이 모자란 답을 내놓지만..)

https://cloud.google.com/prediction/docs (구글 예측 API 문서인데 참고하시길)

저도 데이터 마이닝이나 기계 학습 분야는 거의 문외한이라 잘 몰라서 도움을 못 드리겠지만 그 쪽을 공부해보시는 게 좋을 것 같습니다. https://en.wikipedia.org/wiki/Data_mining https://en.wikipedia.org/wiki/Machine_learning