비트: 컴퓨터가 처리할수있는 가장 작은 정보단위 0 또는 1을 담을 수 있다 => 8비트로는 2의 8승, 256개의 정보를 나타낼 수 있다. 데이터 처리하는 기본 단위를 바이트라고 한다. 1byte = 8bit
유니코드란?
전 세계의 모든 문자를 컴퓨터 상에서 일관되게 표현하기 위한 표준이다.
유니코드는 문자열 셋을 사용하여 각국의 문자와 코드를 대응시켜 둔 표를 만들어 두었다. 변환사이트
ASCII
영문자를 컴퓨터 상에 표현하기 위한 규약으로, 이것을 확장한 것이 유니코드이다.
출력 가능 ASCII 문자는 특수문자(& 등) 공백, 알파벳 대소문자가 있다. 꼭 보기
출력 가능한 문자들은 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자 , 그리고 하나의 공백 문자로 이루어진다
엔코딩과 디코딩
엔코딩이란 사람이 이해할 수 있는 언어를 컴퓨터가 이해할 수 있는 언어로 변환하는 과정이며, 그 반대를 디코딩이라고 한다.
유니코드의 문자열 셋, UTF-8, UTF-16 등이 엔코딩 방식 중의 하나다.
UTF8, UTF16은 둘 다 엔코딩 방식이며, 뒤에 붙은 숫자는 bit수를 의미한다. (8bit = 1byte)