[언어학] 합목적적 말뭉치의 자동 구축
- 최초 등록일
- 2004.01.16
- 최종 저작일
- 2004.01
- 12페이지/ 한컴오피스
- 가격 1,500원
목차
1. 서론
2. 말뭉치의 단위적 구성
3. 구성 단위를 중심으로 한 말뭉치 구축
3.1. 필수 어휘 목록
3.2. 불용 어휘 목록
3.3. 표본의 검사와 선택
3.4 빈도의 재조정
4. 말뭉치 자동 구축의 문제
4.1. 말뭉치의 대표성 확보
4.2. 말뭉치의 크기 결정
4.3. 표본 크기의 결정
4.4. 장르별 구성비 결정
4.5. 구축 지원 도구
4.6. 표본의 확보
본문내용
지금까지 말뭉치 구축에 많은 시간과 노력을 들였음에도 불구하고 구축된 말뭉치가 구축 목적에 충분히 부합하는지 그렇지 않은지는 알기 어렵다. 뿐만 아니라 지금까지 구축된 많은 표본들을 토대로 새로운 구축 목적에 부합하는 말뭉치를 연구자가 임의로 구축하여 활용하는 것은 더욱 어렵다. 말뭉치의 구축 목적을 기준으로 각각의 표본에 대해 사람이 직접 검사하여 표본의 적합 여부를 판단하기가 쉽지 않기 때문이다. 본 연구에서는 이러한 어려움을 해소하기 위해 말뭉치의 구축 목적에 부합하는 표본들을 컴퓨터를 활용하여 자동으로 선별하고, 선별된 표본들로 말뭉치를 구성하는 합목적적인 말뭉치 자동 구축 방법을 제시하고자 한다.
합목적적인 말뭉치를 자동으로 구축하기 위해서는 우선, 말뭉치가 언어 자료의 모음이라는 막연한 정의에서 벗어나 비교, 계산 가능한 형태로 정의되어야 한다. 2장에서 이러한 정의를 살펴보고 그 타당성을 검토한다. 3장에서는 필수 어휘 목록과 불용 어휘 목록을 통해 2장에서 정의한 말뭉치의 항목과 값을 확보하는 방법을 제시하고, 이 방법을 통해 자동화가 가능함을 보일 것이다. 4장에서는 말뭉치 자동 구축이 기존의 말뭉치 구축에서의 문제점을 해결할 수 있음을 보이고, 말뭉치 자동 구축에 있어서 어려운 점들을 제시할 것이다.
참고 자료
없음