리눅스 명령어

문자열

비트: 컴퓨터가 처리할수있는 가장 작은 정보단위 0 또는 1을 담을 수 있다 => 8비트로는 2의 8승, 256개의 정보를 나타낼 수 있다. 데이터 처리하는 기본 단위를 바이트라고 한다. 1byte = 8bit

유니코드란?

전 세계의 모든 문자를 컴퓨터 상에서 일관되게 표현하기 위한 표준이다.

유니코드는 문자열 셋을 사용하여 각국의 문자와 코드를 대응시켜 둔 를 만들어 두었다. 변환사이트

ASCII

영문자를 컴퓨터 상에 표현하기 위한 규약으로, 이것을 확장한 것이 유니코드이다.

출력 가능 ASCII 문자는 특수문자(& 등) 공백, 알파벳 대소문자가 있다. 꼭 보기

출력 가능한 문자들은 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자 , 그리고 하나의 공백 문자로 이루어진다

엔코딩과 디코딩

엔코딩이란 사람이 이해할 수 있는 언어를 컴퓨터가 이해할 수 있는 언어로 변환하는 과정이며, 그 반대를 디코딩이라고 한다.

유니코드의 문자열 셋, UTF-8, UTF-16 등이 엔코딩 방식 중의 하나다.

UTF8, UTF16은 둘 다 엔코딩 방식이며, 뒤에 붙은 숫자는 bit수를 의미한다. (8bit = 1byte)