추천시스템의 성능을 측정하는 metric이 RMSE라는 것은 예상 평점이 높은 상품과 낮은 상품에 동일한 페널티를 부여한다는 것을 뜻합니다. 하지만 실제로 추천시스템에서는 내가 좋아할 것 같은 상품을 추천해주는것, 즉 예상 평점이 높은 상품을 잘 맞추는것이 중요합니다. 이를 고려하여 성능을 측정하기 위해서는 어떻게 해야 할까요?
전체 한 번 학습한 후 높은 평점에 관한 데이터만 뽑아서 다시 학습한다.
여러 모델로 학습해서 나온 결과를 ensemble 할 때 가중치를 준다. (높은 점수에 힘을 실어주자)
P, Q를 곱할 때 큰 가중치가 더해지도록 r에 비례하도록 한다.
질문이 정확히 뭘까요..?
동일한 정규화?
높은 평점일 걸 낮게 평가하는거?
추천 시스템의 성능을 향상시키기 위해서는 어떠한 것을 더 고려할 수 있을까요? (해당 문제는 정답이 제공되지 않는 문제입니다. 자유롭게 여러분의 의견을 이야기해보세요.)
평가되지 않은 영화들에 대해서는 메타 데이터를 이용하여 선호도를 대충 추측한다. 사용 전 선호도는 아이템의 메타 데이터(감독, 배우 등)을, 사용 후 선호도는 아이템 자체의 내용을 기반으로 한다.
사용 전 선호도와 uninteresting item은 어떤 관계가 있을까?
사용 전 선호도는 평점을 매긴 item을 기반으로 한다. unrated item을 사용 전 선호도를 기반으로 파악할 수 있다. 이것을 이용해 임계값을 넘지 못하면 다 0점 처리하는 Zero Injection 방법을 사용한다.
❓질문
MJ
임의보행 중 마주친 모든 정점에 대한 합산
이 언제까지 돌리는 건가요?네거티브 샘플링에서 임의의 u만 뽑아온다면 나머지에 대한 임베딩벡터는 어떻게 구하나요?
펭귄
과적합이 발생할 수 있다
는 의미가 무엇인가요?모형 복잡도 부분 : 릿지, 라쏘 회귀 / weight decay
🤷♀️Further Question🤷♀️
추천시스템의 성능을 측정하는 metric이 RMSE라는 것은 예상 평점이 높은 상품과 낮은 상품에 동일한 페널티를 부여한다는 것을 뜻합니다. 하지만 실제로 추천시스템에서는 내가 좋아할 것 같은 상품을 추천해주는것, 즉 예상 평점이 높은 상품을 잘 맞추는것이 중요합니다. 이를 고려하여 성능을 측정하기 위해서는 어떻게 해야 할까요?
추천 시스템의 성능을 향상시키기 위해서는 어떠한 것을 더 고려할 수 있을까요? (해당 문제는 정답이 제공되지 않는 문제입니다. 자유롭게 여러분의 의견을 이야기해보세요.)