p.147 중복 콘텐츠 인지 파악하기 위해서, 웹 페이지의 해시 값을 비교한다고 되어 있는데, 자세하게 설명해주세요!
p.149 웹 크롤러 작업 흐름에서, 중복 컨텐츠 인지 검증하는 것과 이미 방문한 URL 인지 검증하는 것이 있는데, 중복 컨텐츠인지 검사하면, 이미 방문한 URL 인지도 동시에 검증되는 것이 아닌가요?
중복 콘텐츠인지 : 내용이 같은지? 인 것 같고 / 이미 방문한 URL 인지 : 같은 페이지를 들어왔는지? 뭐가 다른거죠?
p.161 server-side rendering 의 경우 링크를 즉석에서 만들어 내서, 페이지를 파싱하기 전에 서버 측 렌더링을 적용하면 해결 할 수 있다고 하는데, 이 과정을 설명해주세요.
10장
p.176알림 중복 탐지 메커니즘에서 보내야 할 알림이 도착하면 그 이벤트ID를 검사하여 이전에 본 적이 있는 이벤트인지 살핀다고 되어 있는데, 그럼 이전에 보낸 알림에 대해 블룸필터와 같은 방식을 쓰는 건가요? 아니면, 이전 알림을 모두 데이트베이스에 저장해두고 탐색하는 건가요?
9장
p.147
중복 콘텐츠 인지 파악하기 위해서,웹 페이지의 해시 값을 비교한다
고 되어 있는데, 자세하게 설명해주세요!p.149
웹 크롤러 작업 흐름에서, 중복 컨텐츠 인지 검증하는 것과 이미 방문한 URL 인지 검증하는 것이 있는데, 중복 컨텐츠인지 검사하면, 이미 방문한 URL 인지도 동시에 검증되는 것이 아닌가요?p.161
server-side rendering 의 경우 링크를 즉석에서 만들어 내서, 페이지를 파싱하기 전에 서버 측 렌더링을 적용하면 해결 할 수 있다고 하는데, 이 과정을 설명해주세요.10장
p.176
알림 중복 탐지 메커니즘
에서보내야 할 알림이 도착하면 그 이벤트ID를 검사하여 이전에 본 적이 있는 이벤트인지 살핀다
고 되어 있는데, 그럼 이전에 보낸 알림에 대해 블룸필터와 같은 방식을 쓰는 건가요? 아니면, 이전 알림을 모두 데이트베이스에 저장해두고 탐색하는 건가요?