• LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

[말뭉치]말뭉치 처리 방법

*으*
최초 등록일
2005.10.13
최종 저작일
2005.01
3페이지/한글파일 한컴오피스
가격 1,000원 할인쿠폰받기
다운로드
장바구니

소개글

^^

목차

1. 한국어를 반영한 자료의 구축 방법
① 원시 말뭉치 방법(raw corpus)
② 분석 말뭉치방법
③균형 말뭉치방법
④번역 말뭉치방법
⑤ 문자 말뭉치방법
⑥ 이미지 자료방법

2. 한국어를 연구한 전자 자료 방법

본문내용

① 원시 말뭉치 방법(raw corpus)
원시 말뭉치는 기본적인 전자 자료이다. 이것은 이 자료에 대한 출전, 저자, 용량 등의 기본 정보를 나타내는 헤더(header)와 본문(text)으로 구성되어 있다.
1) 헤더
자료의 공유를 위해서는 헤더를 붙이는 양식이 표준화되어 있어야 하는데, 현재 문화관광부에서 시행하고 있는 `국어 정보화 중장기 발전 계획`인 `21세기 세종계획`에서 마련한 헤더의 표준 양식이 있다.
그런데 이 표준 양식 중에서 서지 사항을 표시하는 항목의 기술 내용이 정밀하지 않아서, 특히 이본이 많은 역사 자료는 그 서지 정보의 기술이 불완전한 편이다. 이 점만 보완한다면 21세기 세종계획에서 마련한 헤더의 표준양식은 거의 완벽하다고 할 수 있다. 그래서 옛 문헌에 대한 서지 정보는 별도로 마련하는 것이 좋을 듯하다.

2) 옛 문헌의 서지 정보
옛 문헌에 대한 서지 정보의 기술은 현대 문헌과는 다르다.
옛 문헌의 서지 정보를 헤더 속에 포함시키는 일은 번거로운 일이다. 따라서 이러한 서지 정보는 텍스트 자료로서 입력된 파일 속에 포함시키는 것보다는 오히려 이미지로 만들어 놓은 파일의 앞에 넣어 그 자료의 성격을 파악하도록 하는 것이 좋을 것이다.

3) 본문 입력 양식
본문의 입력 양식은 전자 자료의 양식에서 신중하게 고려해야 할 부분이다. 컴퓨터로 이 자료들을 검색하여 활용하는 부분이기 때문이다.
본문의 입력 방식은 크게 두 가지로 구분된다. 하나는 원문의 구조와 형식까지도 그대로 입력하는 것이고, 또 하나는 원문의 표기나 방점 등은 그대로 반영하되 형식은 가공하여 처리하는 것이다. 원문의 형식에 충실하게 입력한다면, 옛 문헌 자료의 입력 파일은 띄어쓰기가 되어 있어서는 안 된다. 왜냐 하면 옛 문헌에는 대부분이 띄어쓰기가 되어 있지 않기 때문이다. 그리고 행의 바꿈도 원문에 그대로 따라야 한다. 그러나 이러한 입력 방식은 거의 무의미하다. 왜냐하면 이것은 이미지로 처리한 자료와 다르지 않기 때문이다. 그래서 가공 처리하지 않으면 안 된다.

참고 자료

없음
*으*
판매자 유형Bronze개인

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

  • 한글파일 한글 말뭉치 분석 프로그램 ‘깜짝새’ 사용법 2페이지
    불러왔다면 둘째, 원하는 말뭉치를 검색하는 방법이다. ... 말뭉치를 검색한 뒤 조건을 수정하면 된다. ... 한글 말뭉치 분석 프로그램 ‘깜짝새’ 사용법 2바이트로 변환된 파일이라면
  • 한글파일 [국어정보학] 북한의 정보화와 말뭉치(코퍼스) 9페이지
    뭉치 구문 분석 말뭉치 구문 주석을 첨가한 말뭉치 기획방법 균형 말뭉치 ... -말뭉치 구축 방법뭉치 구축의 목적을 세우고 → 적합한 말뭉치를 구축하고 ... 그리고 접사 처리 과정을 거쳐 만들어진 어휘 분석 말뭉치를 대상으로 동음이의어
  • 한글파일 대조언어학 '말이다' 문형 한국어 영어 대조 A+ 보고서 한국어교육 말뭉치 21페이지
    이를 위해 본고가 취할 연구방법은 기본적으로 말뭉치 기반의 접근법이다. ... 있음을사전에서는 {말이다}를 어떻게 처리하고 있는지 살펴보겠다. ... 설명어권 학습자에게 {말이다}를 제시할 방법을 보다 풍성하게 하는 것이다
  • 한글파일 문어 형태의미분석 말뭉치 내 소설 분야에 대한 계량적 연구 10페이지
    뭉치에 기반한 언어 연구의 방법으로는 주로 통계적인 방법이 사용하고 있으며 ... 본고에서 분석한 방법 역시 전통적인 범위를 벗어난 문어 형태의미분석 말뭉치 ... 정도로서가 아니라 기계 번역과 같은 고난도 컴퓨터에 의한 ‘자연 언어 처리
  • 한글파일 [A+ 과제 레포트 / 국어학개론] 응용언어학의 여러 분야 11페이지
    연구 분야 1)구조언어학 2)말뭉치언어학 3)대조언어학 4)비교언어학 Ⅲ ... 대신 말뭉치에 다가갈 수 있는 최소한의 인터페이스만 있으면 실제 언어를 통해 ... 말뭉치 언어학에서는 언어능력(competence)과 언어수행(performance
더보기
최근 본 자료더보기
탑툰 이벤트
[말뭉치]말뭉치 처리 방법
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업