Open syleeie2310 opened 4 months ago
유클리드 거리 (평면에서 두 점 사이의 직선 거리를 계산하는 방식)
haversine Fourmula ㄴ 피타고라스 정리 (곡선 반영한 방식)
Geodesic
pandas_udf 함수 ㄴ cocount 5개 이상.
-vincenty 공식 함수로 거리 계산 방식 함수로 구현
좌표 거리 계산 완료 내용
1. 거리가 위도/경도가 데이터 잘못 찍혀진 데이터 수정
2. 거리계산 분포 [분포] [최소,최대,평균,분산값]
---> 거리계산값 hive_metastore.test.cali_cocount_distance_all_result_final_4 테이블 저장
3. 이상치 기준 설정
좌표계 데이터 분석
CF 모델 (아이템 추천 모델) 활용할지가 가장 중요
거리를 어떻게 계산할거냐? ㄴ 좌표계 가지고 유클리디안 거리. 거리 계산 방식이 여러가지 있어서 리서치 필요
꼭 거리가 유사하지 않아도 지역 기준에서 방식이 여러가지 있을 수 있을거 같은데..
그외 데이터 탐색 보고 싶은거 있으시면 봐도 됨.