HTML & CSS

[41-7 HTML] UTF-8, 유니코드

Olivia-BlackCherry 2022. 10. 5. 17:11

1. utf-8

웹페이지 안의 모든 text가 UTF-8 인코딩 시스템으로 인코딩 되어

웹사이트를 문제 없이 보도록 한다.

 

간혹 웹사이트를 열었을 때, 

우리가 알아볼 수 없는 글자로 웹사이트가 해석한 것을 볼 때가 있는데 

이것을 변형된 캐릭터를 뜻하는 모지마케라고 쓴다.

모지바케가 나타나는 까닭은 브라우저가 잘못된 문자 집합을 사용하여 

문자를 렌더링하면서 웹브라우저가 데이터를 이상한 글자로 보여주게 되는 것이다.

 

UTF-08은 HTML 5로 작업할 때 사용하는 표준 인코딩이다.

국제 기호가 모두 포함되어 있기 때문이다. 

아래의 그림과 웹사이트는 

웹사이트 내에서 올바르게 렌더링하기 위해 사용하는 UTF-8 문자 목록이다.

https://www.fileformat.info/info/charset/UTF-8/list.htm

 

 

2. 유니코드

유니코드는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준인데,

유니코드 역시 UTF-8에 맞게 인코딩할 수 있다.

그러면 어떤 해외 사용자가 내 웹사이트에 방문한다고 해도, 

올바르게 렌더링된 내용을 볼 수 있을 것이다.

<유니코드 테이블 목록> --->https://unicode-table.com/en/

 

 

3. 좋은 글

최대 호환성을 보장하기 위해 웹사이트에서 유니코드 또는 UTF-8과 같은 것을 사용해야 하는 이유에 대한 설명

문자집합과 이 문자 집합이 다른 기호를 인코딩하는 방법에 관한 좋은 글

 

https://www.joelonsoftware.com/2003/10/08/the-absolute-minimum-every-software-developer-absolutely-positively-must-know-about-unicode-and-character-sets-no-excuses/