[국어정보학]철자검사기 정의및 분석
- 최초 등록일
- 2007.10.22
- 최종 저작일
- 2007.07
- 5페이지/ 한컴오피스
- 가격 1,500원
소개글
국어정보학이나 사전학분야를 공부하시는 분들께 아주 유용한 자료가 될것입니다.
특히 철자검사기나 국어정보학에 관한 리포트를 쓰시는 분들에게 유용합니다.
많은 참고바랍니다.
참고로 저는 이리포트로 발표하여 중간고사 대체리포트로 A+나왔습니다.
목차
1.철자 검사기란?
2 철자 검사기의 교정 대상
․ 오류의 유형
․ 현재 사용하는 철자 오류 프로그램
․ 우리말 철자 검사기에서 교정의 대상
․ 철자 검사기의 교정 대상이 되는 어절 유형(오류의 원인에 따라)
3. 철자 검사기의 구현 방법
3.1 철자 오류 검사
3.1.1 사전을 이용하는 방법
3.1.2 형태소 분석기를 이용하는 방법
3.2 철자 오류 교정
가. 철자 오류 교정 단계의 목적
나. 철자오류 단계에서 가장 중요한 것
다. 철자 오류 교정 방법
4. 철자 검사기의 전망 및 과제
*참고문헌*
본문내용
3.2 철자 오류 교정
가. 철자 오류 교정 단계의 목적: 철자 오류 검사 단계에서 발견한 오류를 바탕으로 사용자가 의도한 원래 낱말을 찾는 것이 주된 목적이다. 그러나 사용자가 의도한 정확한 낱말을 찾아내는 일은 매우 어려운 일이기도 하다. 따라서 이러한 작업을 할 때는 찾아낸 오류를 바탕으로 가능한 후보어를 모두 제시해 주고 사용자가 최종선택을 하는 방식을 취한다.
나. 철자오류 단계에서 가장 중요한 것: 후보어를 제시할 때 가장 가능성 있는 후보어부터 순서대로 제시하는 방법이다. 이를 위해 오류의 유형을 분류하고, 다양한 방법으로 분류된 유형에 맞는 후보어를 제시하게 된다.
다. 철자 오류 교정 방법
①어휘 사전 비교법
오류어를 사전의 모든 낱말(혹은 형태소)과 비교하여 오류어와 가장 거리가 가까운 낱말을 후보로 제시하는 최단 편집거리 기법과 오류어에 대해 문자 대치가 가능한 모든 후보어를 생성한 다음 후보어에 대해 사전을 탐색하는 역최단 편집 거리 기법이 있다. 역최단 편집 거리 기법은 단점이 있는데 사전의 크기가 커진다는 점과 조사나 어미에 어형 변화가 많은 우리말의 경우 더 큰 문제가 된다.
②규칙 기반 방법
오류어를 올바른 낱말로 바꾸는 규칙을 찾고 이를 통하여 후보어를 제시하는 방법이다. 예를 들면 오류를 규칙화하고 이를 바탕으로 오류어로부터 후보어를 생성한다든지 각 규칙에 우선 순위를 나타내는 가중치를 부여하여 후보어의 우선순위를 결정하는 것이 있다.
참고 자료
1.서상규외, [국어정보학 입문], 태학사, 2002
2.한국과학기술원, [국어 정보 처리 기반 구축을 위한 연구 보고서], 한국과학기술원(1998)
3.강범모, [언어, 컴퓨터, 코퍼스 언어학]. 고려대학교 출판부, 2003
*참고 싸이트*
1.http://ikc.korea.ac.kr/~bmkang/
2.http://www.sejong.or.kr/sejong_kr/index.html