국어의 정보화
- 최초 등록일
- 2012.01.03
- 최종 저작일
- 2011.11
- 10페이지/ 한컴오피스
- 가격 2,000원
소개글
국어의 정보화에 대한 전반적인 내용입니다.
이 파트는 다른 전공책에서도 찾기 힘든데, 여러 관련 서적에서 찾아서 만든 레포트입니다.
A+받은 것이니 많은 참고 하셔서 도움 되시길 바랍니다
목차
1. 국어정보화의 개념
2. 국어 정보화의 필요성
3. 국어 정보화의 변천과 현황
4. 국어 정보화 정책의 역사
5. 현행 정책의 검토 – 21세기 세종계획을 중심으로
6. 국어 정보화의 실제 응용
7. 국어 정보화의 미래 방향성
8. 교과서 분석
본문내용
4) 코퍼스(corpus)
코퍼스는 ‘말뭉치’ 또는 ‘말모둠’으로 문자 또는 음성 텍스트를 모아 놓은 것이다. 예를 들어 소설가 이문열의 저작들을 모아 놓은 것은 이문열 코퍼스가 되는 것이다. 현대 코퍼스 언어학에서 말하는 코퍼스는 컴퓨터에 저장된 전자화된 텍스트로 컴퓨터로 처리할 수 있는 말뭉치를 의미한다.
➀ 코퍼스 기반 언어 분석의 활용
코퍼스는 ‘말뭉치’ 또는 ‘말모둠’으로 문자 또는 음성 텍스트를 모아 놓은 것이다. 예를 들어 소설가 이문열의 저작들을 모아 놓은 것은 이문열 코퍼스가 되는 것이다. 현대 코퍼스 언어학에서 말하는 코퍼스는 컴퓨터에 저장된 전자화된 텍스트로 컴퓨터로 처리할 수 있는 말뭉치를 의미한다.
ㄱ. 빈도 정보
- 이를 통해 어떠한 단어가 실제로 빈번히 사용되고, 쓰이지 않는 단어는 어떤 것인지 파악할 수 있기 때문에 언어 연구에 유용하게 쓰인다. 또한 빈도 결과를 기초로 하여 사전 표제어의 선정 작업에도 쓰이고 있다.
예) ‘갖가지’와 ‘가지가지’의 빈도를 실제 코퍼스에서 살펴보면 천만 어절 코퍼스에서 ‘갖가지’는 17번 출현하고, ‘가지가지’는 같은 코퍼스에서 391회 출현한다.
참고 자료
최용기, 남북한 국어 정책 변천사 연구, 단국대학교, 2002.
임지룡 외, 문법교육론, 역락, 2010.
한정한 외, 한국어 정보처리 입문, 2007.
정경일 외, 한국어의 탐구와 이해, 박이정, 2009.