실제로는 하나의 아스키 문자를 나타내기 위해 8비트(1바이트)를 사용하지만, 8비트 중 1비트는 패리티 비트라고 불리는 오류 검출을 위해 사용되는 비트이기 때문에 실질적으로 문자 표현을 위해 사용되는 비트는 7비트다.
아스키 코드: 아스키 문자에 대응된 고유한 수
장점: 매우 간단하게 인코딩된다.
단점: 한글, 아스키 문자 집합 외의 문자, 특수문자를 표현할 수 없다. 훗날 아스키 코드에 1비트를 추가한 8비트의 확장 아스키가 등장하기도 했지만, 여전히 표현 가능한 문자의 수는 부족했다. 그래서 한국을 포함한 영어권 외의 나라들은 자신들의 언어를 0과 1로 표현할 수 있는 고유한 문자 집합과 인코딩 방식이 필요하다고 생각했다.
코드 포인트: 글자에 보여된 고유한 값
유니코드
EUC-KR보다 훨씬 다양한 한글을 포함하고, 대부분 나라의 문자, 특수문자, 화살표, 이모티콘까지도 코드로 표현할 수 있는 통일된 문자 집합이다.
현대 문자를 표현할 때 가장 많이 사용되는 표준 문자 집합이다.
글자에 부여된 값 자체를 인코딩된 값으로 사용하지 않고, 이 값을 다양한 방법으로 인코딩한다.
문자 집합
문자 인코딩
문자 디코딩