Effective-Java-Camp / http-the-definitive-guide

[DONE] HTTP 완벽 가이드 스터디 레포지토리
0 stars 0 forks source link

[1부 1장] HTTP 개관 #2

Open vo0a opened 2 years ago

vo0a commented 2 years ago

1장 HTTP 개관

1.1 HTTP: 인터넷의 멀티미디어 배달부

1.2 웹 클라이언트와 서버

월드 와이드 웹의 기본 요소

1.3 리소스

웹 서버는 웹 리소스를 관리하고 제공한다. 웹 리소스는 웹 콘텐츠의 원천이다. 어떤 종류의 콘텐츠 소스도 리소스가 될 수 있다.

1.3.1 미디어 타입

HTTP는 웹에서 전송되는 객체 각각에 신중하게 MIME(Multipurpose Internet Mail Extensions, 다목적 인터넷 메일 확장) 타입이라는 데이터 포맷 라벨을 붙인다. 웹 브라우저는 서버로부터 객체를 돌려 받을 때 다룰 수 있는 객체인지 MIME 타입을 통해 확인한다.

1.3.2 URI

서버 리소스 이름은 통합 자원 식별자(uniform resource identifier), 혹은URI로 불린다. URI는 정보 리소스를 고유하게 식별하고 위치를 지정할 수 있다. URI는 URL과 URN이 있다.

1.3.3 URL

통합 자원 지시자(uniform resource locator, URL)는 특정 서버의 한 리소스에 대한 구체적인 위치를 서술한다.

오늘날 대부분의 URI는 URL이다.

1.3.4 URN

URN(uniform resource name)콘텐츠를 이루는 한 리소스에 대해, 그 리소스의 위치에 영향 받지 않는 유일무이한 이름 역할을 한다.

여전히 실험 중이 상태고 아직 널리 채택되지 않았다.

1.4 트랜잭션

HTTP 트랜잭션은 요청 명령과 응답 결과로 구성되어 있다. 이 상호작용은 HTTP 메시지라고 불리는 정형화된 데이터 덩어리를 이용해 이루어진다.

1.4.1 메서드

HTTP 요청 메시지는 한 개의 메서드를 갖는다. 메서드는 서버에게 어떤 동작이 취해져야 하는지 말해준다.

HTTP 메서드 다섯 개

1.4.2 상태 코드

모든 HTTP 응답 메시지는 상태 코드와 함께 반환된다. 상태 코드는 클라이언트에게 요청이 성공했는지 아니면 추가 조치가 필요한지 알려주는 세 자리 숫자다.

1.4.3 웹 페이지는 여러 객체로 이루어질 수 있다.

애플리케이션은 보통 하나의 작업을 수행하기 위해 여러 HTTP 트랜잭션을 수행한다.

1.5 메시지

HTTP 메시지는 단순한 줄 단위의 문자열이다. 이진 형식이 아닌 일반 텍스트이기 때문에 사람이 읽고 쓰기 쉽다. HTTP 요청과 응답 메시지의 두 가지의 메시지가 있다.

HTTP 메시지는 다음 세 부분으로 이루어진다.

image

1.6 TCP 커넥션

1.6.1 TCP/IP

HTTP는 애플리케이션 계층 프로토콜이다. 대중적이고 신뢰성 있는 인터넷 전송 프로토콜인 TCP/IP에게 맡긴다.

TCP는 다음을 제공한다.

  1. 오류 없는 데이터 전송
  2. 순서에 맞는 전달
  3. 조각나지 않는 데이터 스트림

일단 TCP 커넥션이 맺어지면, 클라이언트와 서버 컴퓨터 간에 교환되는 메시지가 없어지거나 손상되거나, 순서가 뒤바뀌어 수신되는 일은 결코 없다.

1.6.2 접속, IP주소 그리고 포트번호

TCP에서는 서버 컴퓨터에 대한 IP 주소와 그 서버에서 실행 중인 프로그램이 사용 중인 포트 번호가 필요하다.

웹 브라우저가 HTTP리소스를 사용자에게 보여주는 절차

  1. 웹 브라우저는 서브의 URL에서 호스트 명을 추출한다.
  2. 웹 브라우저는 서버의 호스트 명을 IP로 반환한다. → DNS(Domain Name System)
  3. 웹 브라우저는 URL에서 포트번호(있다면)를 추출한다.
  4. 웹 브라우저는 웹 서버와 TCP 커넥션을 맺는다.
  5. 웹 브라우저는 서버에 HTTP 요청을 보낸다.
  6. 서버는 웹 브라우저에 HTTP 응답을 돌려준다.
  7. 커넥션이 닫히면, 웹 브라우저는 문서를 보여준다.

1.7 프로토콜 버전

https://dar0m.tistory.com/211

HTTP/0.9

심각한 디자인 결함이 다수 있고 구식 클라이언트하고만 같이 사용할 수 있다. 오직 GET 메서드만 지원하고, 멀티미디어 콘텐츠에 대한 MIME 타입이나, HTTP 헤더, 버전 정보는 지원하지 않는다.

HTTP/1.0

버전 번호, HTTP 헤더, 추가 메서드, 멀티미디어 객체 처리를 추가하였다. 시각적으로 매력적인 웹 페이지와 상호작용하는 폼을 실현했고 이는 월드 와이드 웹을 대세로 만들었다.

HTTP/1.0+

오래 지속되는 "keep-alive" 커넥션, 가상 호스팅 지원, 프락시 연결 지원을 포함해 많은 기능이 HTTP에 추가되었다.

HTTP/1.1

HTTP 설계의 구조적 결함 교정, 두드러진 성능 최적화, 잘못된 기능 제거에 집중하였다. 현재의 HTTP 버전

HTTP/2.0

HTTP/1.1 성능 문제를 개선하기 위해 구글의 SPDY 프로토콜을 기반으로 설계가 진행 중인 프로토콜이다.

1.8 웹의 구성요소

1.8.1 프록시

클라이언트와 서버 사이에 위치한 HTTP 중개자이다. 주로 보안을 위해 사용되고 모든 웹 트래픽 흐름 속에서 신뢰할만한 중개자 역할을 한다. 또한 요청과 응답을 필터링한다.

1.8.2 캐시

많이 찾는 웹 페이지를 클라이언트 가까이에 보관하는 HTTP 창고이다. 다음번에 클라이언트가 같은 문서를 요청하면 그 캐시가 갖고 있는 사본을 받을 수 있다.

1.8.3 게이트웨이

다른 애플리케이션과 연결된 특별한 웹 서버이다. 주로 HTTP 트래픽을 다른 프로토콜로 변화하기 위해 사용된다. 언제나 스스로기 리소스를 자고 있는 진짜 서버인 것처럼 요청을 다룬다.

1.8.4 터널

단순히 HTTP 통신을 전달하기만 하는 특별한 프록시이다. 비 HTTP 데이터를 하나 이상의 HTTP 연결을 통해 그대로 전송해주기 위해 사용된다.

데이터 보호되는 영역(보안 터널). HTTP는 평문이니까 메시지의 내용이 안보이게 터널로 통신 ^^

ex) 암호화된 SSL 트래픽을 HTTP 커넥션으로 전송함으로써 웹 트래픽만 허용하는 사내 방화벽을 통과시킨다.

https://blog.kakaocdn.net/dn/KSzs9/btrfHd4ureq/aFx8cOqXO23a6c5kXnx6J1/img.png

1.8.5 에이전트

사용자를 위해 HTTP 요청을 만들어주는 클라이언트 프로그램

웹에서는 브라우저가 에이전트

더 살펴보기

지금까지 1장은 HTTP 개요로 웹의 구성요소를 넓고 얇게 다뤘다.

그 중 기억에 남는 두 가지를 더 살펴보려 한다. 바로 '터널'과 '웹 브라우저가 HTTP리소스를 사용자에게 보여주는 절차'이다.

먼저,

터널이란 HTTP 커넥션을 사용해 HTTP가 아닌 트래픽을 전송하는데 사용되는 특별한 프록시이다.

터널링은 계층이 동일하거나 하위의 다른 프로토콜을 숨기기 위해 상위에서 데이터를 캡슐화하고, 외부 네트워크를 통과하여 목적지에 도착한뒤 다시 디캡슐화까지 하는 통신과정을 일컫는 말이다.

웹 터널은 원래 방화벽을 통해 암호화된 SSL 트래픽을 전달하려고 개발되었습니다. 많은 회사들은 강력한 보안을 위해 모든 트래픽의 패킷을 필터링하는 라우터, 프록시를 지나게 하였는데 SSL 프로토콜은 정보가 암호화되어 옛날 방식의 프록시에서는 처리되지않았고, 터널을 이용해 80포트의 HTTP만을 허용하는 방화벽을 통과시켜 기존 프록시 방화벽을 통과할 수 있게 되었다.

단점으로 이를 통해 악의적인 트래픽이 유입될 수 있다.

터널링을 사용하는 경우

image

또한 SSL 얘기가 나와 HTTPS연결을 맺기 위해 SSL 핸드쉐이크 하는 과정도 찾아봤다.

https://blog.kakaocdn.net/dn/c5vaOk/btrci8mWrVX/QhcK5qsBD11RbfuGqMss71/img.png

두 번째로

'웹 브라우저가 HTTP 리소스를 사용자에게 보여주는 절차'이다.

면접 준비할 때 단골 질문으로 많이 나오는 내용

https://blog.kakaocdn.net/dn/E0HZM/btrdFnvMUvo/8QYYRaOiNeOzlJlG16NCi1/img.png

  1. 웹 브라우저는 서브의 URL에서 호스트 명을 추출한다.
  2. 웹 브라우저는 서버의 호스트 명을 IP로 반환한다.
  3. 웹 브라우저는 URL에서 포트번호(있다면)를 추출한다.
  4. 웹 브라우저는 웹 서버와 TCP 커넥션을 맺는다.
  5. 웹 브라우저는 서버에 HTTP 요청을 보낸다.
  6. 서버는 웹 브라우저에 HTTP 응답을 돌려준다.
  7. 커넥션이 닫히면, 웹 브라우저는 문서를 보여준다.

특히 아래 2번은 DNS(Domain Name System) 서버가 하게 되고, DNS 의 서버 작동은 아래와 같다.

https://blog.kakaocdn.net/dn/HwzkL/btrdC5o7dqP/79DQ3CECQGoa8Vd0Gn1091/img.png

이런 과정을 통해서 사용자가 서버 통신의 결과를 받을 수 있게 됩니다.

마치며

1장이었기 때문에 전반적으로 얕게 다루는 부분이 많았고, 기존에 공부했던 것들을 상기하고 새로 습득한 지식과 연결짓는 과정이 재밌지만 쉽지 않은 것 같습니다. 앞으로 다음 장 가면서 더 세세한 부분을 많이 배울 수 있을 것 같아 기대가 됩니다.

kmswlee commented 2 years ago

SSL 통신과정은 저는 이게 좀 더 이해하기 편했던거 같습니다. 링크 : https://github.com/WooVictory/Ready-For-Tech-Interview/blob/master/Network/HTTP%2C%20HTTPS.md

ruthetum commented 2 years ago

HTTP 1.0 vs HTTP 1.1 vs HTTP 2.0

SooKim1110 commented 2 years ago

HTTP 상태코드 408 vs 504

https://stackoverflow.com/questions/36392755/what-is-the-difference-between-http-408-and-504-errors

HTTP 3.0

왜 UDP 를 선택했나 https://evan-moon.github.io/2019/10/08/what-is-http3/

vo0a commented 2 years ago

도메인 부여 과정 https://velog.io/@minj9_6/DNS%EC%99%80-%EC%9E%91%EB%8F%99%EC%9B%90%EB%A6%AC