[프로그래밍] UCS-2, -4, -8의 정의와 문제점 및 우수성과 성질(UTF-8의 디코딩 처리 순서의 중요점, 모드의 활성화)

등록일 2003.11.06 한글 (hwp) | 4페이지 | 가격 1,000원

목차

1. UCS와 ISO 10646는 무엇인가?
2. UCS-2(UCS-4)는 무엇인가?
3. USC-2(USC-4)의 문제점
4. UTF-8의 우수성
5. UTF-8의 성질
6. UTF-8의 디코딩 처리 순서의 중요점
7. UTF-8 모드의 활성화

본문내용

1. UCS와 ISO 10646는 무엇인가?
ISO 10646국제 표준은 Universal Character Set(UCS)를 정의하고 있다. UCS는 모든 다른 종류의 문자셋 표준(character set standards)의 상위에 존재하는 문자셋이다. 이것은 다른 문자셋과의 상호 호환성을 보증한다. 만약 어떤 텍스트 문자열을 UCS로 변환하고 다시 원래의 인코딩으로 변환할 경우 어떤 정보도 손실되지 않을 것이다. ISO 10646은 공식적으로 31비트 문자셋을 정의하고 있다. 그러나 지금까지 문자들은 이러한 큰 코드 공간(of this huge code space)중에서도 오직 처음에서부터 65534번째 위치(0x0000부터 0xFFFD까지)까지에만 위치했었다. 이러한 UCS의 16비트 서브셋은 기본적인 다국언어용 영역(Bagic Multilingual Plane : BMP) 혹은 영역 0(Plane 0)라고 부른다. BMP 영역을 벗어나 인코딩 될 것이 예상되는 문자들은 역사적 혹은 과학적 목적으로 단지 전문가들만이 사용하는 약간 색다른 언어에 모두 포함된다(예: 상형문자). 현재 계획은 0x000000부터 0x10FFFF까지의 21비트 코드 공간의 외부에 할당되는 문자들은 없을 것이라고 제안하고 있다.

참고 자료

번역 :
ClickQ EK 1.5 버전

참고 문헌(URL)
http://kdaq.empas.com/dbdic/db_view.jsp?ps=src&num=3255727
http://doc.kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP-2.html
http://chongyang-gch.hs.kr/nksks/haksep/main/jobguid/job7.htm
http://mail.mizi.com/
http://doc.kldp.org/
http://www.javastudy.co.kr

이 자료와 함께 구매한 자료

      최근 구매한 회원 학교정보 보기
      1. 최근 2주간 다운받은 회원수와 학교정보이며
         구매한 본인의 구매정보도 함께 표시됩니다.
      2. 매시 정각마다 업데이트 됩니다. (02:00 ~ 21:00)
      3. 구매자의 학교정보가 없는 경우 기타로 표시됩니다.
      최근 본 자료더보기