[국어정보처리론] 형태소 분석
- 최초 등록일
- 2004.06.11
- 최종 저작일
- 2004.06
- 4페이지/ 한컴오피스
- 가격 1,000원
소개글
열심히 한 레폿...
목차
1. 형태소 분석의 개요
2. 형태소 분석기
3. 최근의 연구 동향
본문내용
1. 형태소 분석의 개요
한국어는 교착어로서 문장의 단위라 할 수 있는 어절이 어휘 형태소와 문법 형태소의 결합으로 이루어져 있으며, 문법 형태소가 문장에서의 문법적 기능을 지시하는 특징을 가지고 있다. 따라서 문장에서 어떤 단어의 문법적 기능을 알기 위해서는 무엇보다도 어절을 형태소 단위로 분리하는 작업이 선행 되어야 한다. 이는 기계번역 또는 정보검색, 혹은 그 밖의 어떠한 한국어 처리를 바탕으로 하는 응용 시스템에 있어서도 필수적으로 요구되는 단계이다. 이 때, 분석을 위해 필요한 최소단위가 형태소 이므로 이를 ‘형태소 분석’ 이라고 한다.
형태소를 분석하는 문제는 곧 형태소 분리의 문제가 된가 따라서 이들을 형태소 분리(morphological segmentation) 혹은 단어 분리(word seg mentation)라 하기도 한다.
한국어의 경우 어절간의 띄어쓰기가 있다는 점에서 중국어와 일본어와는 약간 다른데 이는 중국어와 일본어와는 달리 하나의 어절 단위로 분석이 가능하다는 것을 의미한다. 따라서 대부분의 한국어 형태소 분석에는 어절 내부에서 형태소간의 결합 및 상태 전이에 따라 분석이 이루어지는데, 개략적인 모델은 다음의 [그림1]과 같다.
참고 자료
없음