반응형
안녕하세요.
오늘은 유니코드를 변환해주는 사이트에 대한 정보를 들고 왔어요.
유니코드란? UNICODE
초기 컴퓨터에서는 아스키 코드를 사용해 문자를 다루었는데,
아스키 코드는 8비트만을 사용해 총 256개의 문자만을 표현할 수 있었습니다.
전 세계 모든 문자를 수용하기 위해서는 아스키 코드를 대체할 산업 표준 코드가 필요해졌습니다.
유니 코드는 16비트를 사용해 총 1,114,112가지 문자를 표현할 수 있습니다.
문자에는 전 세계의 문자, 알고리즘, 이모지 등 모든 문자 형태가 포함됩니다.
그 중 한글은 한자 다음으로 코드표에서 가장 많은 부분을 차지하는 언어라고 합니다.
UTF-8은 인코딩 방식 중 하나
UTF-8은 Unicode Transformation Format의 약자로,
유니코드를 변환하는 방식입니다.
16비트로 이루어진 유니코드를 8비트 (1Byte) 기준으로 인코딩하겠다는 뜻입니다.
데이터베이스에 삽입되는 문자의 기본 설정이 UTF-8이라고 할 수 있습니다.
유니코드와 인코딩을 사용하는 이유
- 유니코드: 전세계 언어의 문자를 컴퓨터로 처리하기 위해
- 아스키코드는 영어만 표현할 수 있어 다른 언어들도 각자 표준을 만들었습니다.
- 그러자 여러 개의 표준이 혼재해 오히려 혼동이 야기되었습니다.
- 유니코드의 등장으로 전세계 언어의 문자 및 특수문자, 이모지 등을 표현가능해졌습니다.
- 인코딩: 유니코드 문자를 해석하기 위해
- 문자 인코딩이란 문자 코드표를 해석하는 방법입니다.
- CPU에서 데이터를 처리하거나 네트워크로 데이터를 전송할 때 데이터 크기가 고정적이라면,
불필요한 메모리 낭비가 생길 수 있습니다. - 개발자는 메모리 사용량을 최적화하기 위해 인코딩 방식을 지정해 문자별로 메모리 공간을 유동적으로 사용할 수 있습니다.
유니코드 변환 사이트
주소: https://www.learnkoreantools.com/kr/korean-to-unicode
예제: 유니코드를 한국어로 변환
다음과 같이 유니코드로 입력한 것이 한글로 잘 출력되는 것을 확인할 수 있습니다.
반응형