seunggyo9 / open_source

MIT License
0 stars 1 forks source link

2024-5-14 회의록 #2

Open seunggyo9 opened 4 months ago

seunggyo9 commented 4 months ago

## 의논한 내용

  1. 병원과 관련된 공공데이터 자료 // 김지석 의견

    • 공공데이터 포털에 "건강보험심사평가원_전국 병의원 및 약국 현황" 빅데이터 파일이 올라와 있음
    • 해당 파일은 2024년 3월 기준으로 조사 결과가 게시되어 있음
    • https://www.data.go.kr/data/15051059/fileData.do
    • 해당 엑셀 파일에서 지역을 제주로 설정한 결과, 1036개의 병의원이 나옴
    • 이 엑셀 파일을 기준으로 잡아서 병원 종류나, 지역 등등 구분을 한 뒤 웹크롤링을 진행하면 좋다고 생각함 // 정승교 의견
    • 인터넷에 찾아보니 리뷰데이터의 경우에는 카카오 api를 활용하여 긁어오는 사례가 이미 존재함 (카페)
    • https://taek98.tistory.com/32
    • 위 사례를 참고하여 병원 관련 리뷰를 크롤링하는것이 가능하다고 생각함
  2. 웹크롤링 오픈소스

  3. 그외 자료

  4. 구글 클라우드

    • 우리조에서 구글 클라우드에서 제공하는 기능중 활용할 기능 있는 찾아보기
seunggyo9 commented 4 months ago

공공데이터 포털에 있는 자료 매우 좋습니다! 이 자료를 토대로 카카오맵에 있는 병원들을 크롤링 해오는 작업을 진행하면 좋을 듯 합니다.

ohdohyup commented 4 months ago

저는 공공데이터에서 파일 받고 리뷰는 또 따로 네이버나 카카오에서 크롤링 하는 과정이 복잡할 수 있다고 생각해서 단순하게 많은 정보의 양과 사용하는 사용자들이 많은 네이버맵에서 병명과 지역정도 검색후 리뷰를 크롤링하는 것이 좀 더 간단 할 것 같아서 의견 남겨봐요!

네이버 지도에서 (지역) + (관련과 or 병명) 검색-> 적합한 병원을 찾아 네이버 지도에서 상세 정보 습득 -> 키워드 리뷰를 통해 최종결정

네이버 영수증을 통한 키워드 리뷰는 조작이나 광고의 위험이 적어서 좀 더 믿을 수 있다고 생각함.

https://velog.io/@jahommer/%EB%84%A4%EC%9D%B4%EB%B2%84-%EB%A7%B5-%ED%81%AC%EB%A1%A4%EB%A7%81-seleniumbs4re-%ED%82%A4%EC%9B%8C%EB%93%9C-%EB%A6%AC%EB%B7%B0

위 사례를 이용해서 병원리뷰도 비슷하게 할 수 있을 것 같아요!

seunggyo9 commented 4 months ago

네이버맵에서 크롤링 하는 것도 좋을 것 같네요!! 저도 여러가지 생각을 해보았는데 네이버지도 또는 카카오맵에서 리뷰를 크롤링 해오면 간단할 것 같긴 합니다! 그리고 도협님 의견처럼 요즘 리뷰 알바도 있는 만큼 리뷰의 신뢰성이 중요하다고 생각하는데 네이버 영수증을 통한 리뷰는 신뢰성이 더 좋을 것 같네요! 좋은 의견 감사합니다!

ohdohyup commented 4 months ago

https://dduniverse.tistory.com/entry/python-%EB%84%A4%EC%9D%B4%EB%B2%84-%EC%A7%80%EB%8F%84%EC%97%90%EC%84%9C-%EB%A6%AC%EB%B7%B0-%ED%81%AC%EB%A1%A4%EB%A7%81%ED%95%98%EA%B8%B0-with-Selenium-BeautifulSoup