허프만 알고리즘
- 최초 등록일
- 2003.06.24
- 최종 저작일
- 2003.06
- 13페이지/ 한컴오피스
- 가격 2,000원
소개글
허프만 알고리즘을 사용한 한글 텍스트 파일(unicode)의 압축 에 대해 조사한 레포트이며 설명과 소스코드를 같이 첨부 하였음.
목차
◎ 유니코드란?
◎ 한글 유니코드의 구조
◎ 허프만 알고리즘이란?
◎ 유니코드 의 허프만 알고리즘 최적화..
◎ 한글 유니코드 허프만 알고리즘
◎ 이진트리
◎ 결과 화면
◎ 소스코드
본문내용
◎ 유니코드란?
유니코드라는 것은 '세계 문자 표준'이라고 할 수 있는 것으로, 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약을 말한다.
일반적으로 메모리의 낭비위험이 있기때문에 컴퓨터 사용자들은 보다 현실적인 코드인 2바이트 조합형을 선호하는데, 이 코드로서 만들어질 수있는 한글인 11172자를 유니코드상에 "가나다순" 으로 배열하게 된 것이다. 유니 코드 자체는 완성형의 성격을 띄고 있다 그러나 기존의 KSC 5601-87과 같은 절음발이 한글이 아닌 모든 한글이 포함되어 있으므로 간단한 계산만으로 조합형 코드를 얻을 수 있다. (기존의 KSC 5601-87은 변환 테이블을 이용해야만 했다.)
유니코드 2.0에 채택된 한글코드는 '가'부터 'ㅎ'까지 11,172자가 연속된 공간에 배당되었기 때문에 간단한 계산 식으로도 한글의 자소를 분리해 낼 수 있다. 11172자를 배당하기 위해 11,172자의 영역만 있으면 된다.
참고 자료
없음