본문 바로가기

카테고리 없음

퓨니코드 - 한글도메인 처리

도메인 주소 중에 한글로 된 도메인 주소가 있다. 그럼 이런 도메인은 DNS에서 어떻게 등록하고 처리되는 것인가?

 

바로 퓨니코드라는 것으로 변경하여서 등록하고 처리를 하게 된다. 우선 네이버 지식백과에서 찾아보면 '퓨니코드'라는 것은 다음과 같다.

 

  

 

퓨니코드 [Punycode]

 

 애플리케이션 국제화 도메인 네임(IDNA)의 기반하에서 다국어 도메인이 아스키로 변환(encoding)된 구문. 다국어 문자셋으로부터 온 코드 포인트들을 기본적인 문자열(영숫자, 하이픈)들로 유일하게 표현한 것으로, IDNA는 다국어 도메인을 처리하기 위한 작동 원리에 의해 인터넷 사용자가 입력한 다국어 도메인 질의는 클라이언트단에서 아스키 기반의 퓨니코드 형태로 변환(xn--로 시작하는 문자열로 변환)되어 네임서버에 전송되며, 네임서버는 퓨니코드 형태의 영역 데이터를 운영한다. 퓨니코드는 RFC 3492에 정의되어 있다.

[네이버 지식백과] 퓨니코드 [Punicode] (IT용어사전, 한국정보통신기술협회) 

 

 

 

 즉, 한글 뿐만이 아니라 세계에서 자국어로 도메인을 가지고 처리할 수 있게 만들어주는 공통적인 표준 코드라고 볼 수 있다.

 (유니코드 문자열을 인코딩 하는 것으로, 유니코드가 지원하는 모든 언어로 도메인 가능)

 

 

 다국어 도메인의 표준화 작업이 이루어지기 전에는 'COM'과 'NET' 등록 사업자이자, 인터넷 기반 시설 서비스 사업자인 Verisign에서 'COM','NET'에 대해서 "레이스코드"와 "퓨니코드"로 병행하였으나,  2004년 5월 2일에 "퓨니코드"로 표준화 되었다.

 

 퓨니코드로의 변환은 서버가 아닌 웹 브라우저 같은 클라이언트 단에서 이뤄지게 되며, IE 7 이후부터는 기본 지원이나 그 이전 버전에서는 별도의 플러그 인 설치가 필요하다.

 

 퓨니코드 문자열에는 제일 앞에 접두어 'xn--'이 붙게 된다.

가령 "네떡지기.com" 을 퓨니코드로 변환하게 되면,  xn--ok0b09cr8eyq0a.com 로 변환이 된다.

 

전환하는 구조에 대한 것은 위키백과를 찾아보면 아래와 같이 나와있다.

  

퓨니코드는 ASCII 문자 집합에 포함되는 문자만 문자열에 남긴 후에, 일반화된 가변 길이 기수법을 사용하여 ASCII에 포함되지 않는 문자들이 원래 문자열에 어떻게 삽입될지를 부호화한다. 이 부호화 과정에서는 코드 포인트가 델타 인코딩으로 저장되기 때문에 삽입될 문자들이 비슷한 코드 포인트를 사용할 경우 짧은 길이로 부호화될 수 있다.

                                                                                                                                                - 위키백과

 

 

 

 퓨니코드로 도메인을 등록하기 위해서는 한글을 퓨니코드로 전환은 아래의 사이트를 참고하면 된다. [2013년 8월 30일 기준]

 

http://domain.blueweb.co.kr/pop_puny.html

 

http://direct.co.kr/domain/punycode.html

 

http://www.inplaza.com/puny/index.php

 

http://www.cypack.com/util/race_converter.html