기계 학습을 이용한 한국어 문장 경계 인식

(주)코리아스칼라

최초 등록일: 2016.04.02
최종 저작일: 2006.12; 12페이지/ 어도비 PDF; 가격 4,300원

다운로드

장바구니

상세정보
자료후기 (0)
자료문의 (0)
판매자정보

* 본 문서는 배포용으로 복사 및 편집이 불가합니다.

서지정보

ㆍ발행기관 : 청운대학교 방송예술연구소 ㆍ수록지정보 : 미디어와 공연예술연구 / 1권
ㆍ저자명 : 임희석

한국어 초록

본 논문은 기계 학습 기법 중에서 메모리 기반 학습을 사용하여 범용의 학습 가능한 한국어 문장 경계 인식기를 제안한다. 제안한 방법은 메모리 기반 학습 알고리즘 중 최 근린 이웃(kNN) 알고리즘을 사용하였으며, 이웃들을 이용한 문장 경계 결정을 위한 스 코어 값 계산을 위한 다양한 가중치 방법을 적용하여 이들을 비교 분석하였다. 문장 경 계 구분을 위한 자질로는 특정 언어나 장르에 제한적이지 않고 범용으로 적용될 수 있 는 자질만을 사용하였다. 성능 실험을 위하여 ETRI 코퍼스와 KAIST 코퍼스를 사용하 였으며, 성능 척도로는 정확도와 재현율이 사용되었다. 실험 결과 제안한 방법은 적은 학습 코퍼스만으로도 98.82%의 문장 정확률과 99.09%의 문장 재현율을 보였다.

영어 초록

This paper proposes a Korean sentence boundary detection system which employs k-nearest neighbor algorithm. We proposed three scoring functions to classify sentence boundary and performed comparative analysis. We uses domain independent linguistic features in order to make a general and robust system. The proposed system was trained and evaluated on the two kinds of corpus; ETRI corpus and KAIST corpus. As experimental results, the proposed system shows about 98.82% precision and 99.09% recall rate even though it was trained on relatively small corpus.

참고 자료

없음

"미디어와 공연예술연구"의 다른 논문

지역 마케팅 홍보에 있어서 관계마케팅 영향요인에 관한 연구20페이지

방송통신 융합시대 문화콘텐츠 산업정책 방향18페이지

한국 언론의 전쟁취재 과정의 문제점과 개선방안22페이지

지역방송광고 현황과 과제25페이지

변형된 QFH를 이용한 위성 DMB 안테나 디자인7페이지

더보기 (4/9)

판매자 정보

코리아스칼라는 정직과 신뢰를 기반으로 학술단체 발전에 도움을 드리고자 하는 기업입니다. 본 사는 본 사가 자체 개발한 솔루션을 통하여 보다 효율적인 업무 관리 뿐만 아니라, 학술지의 데이터베이스화, ARCHIVE를 돕습니다. 본 사의 One Stop Service를 통해 국제적인 학술단체로 함께 도약 할 수 있다고 믿습니다.

주의사항

환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류	중복자료	저작권 없음	설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우	다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함)	인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우	자료의 설명과 실제 자료의 내용이 일치하지 않는 경우