Text Mining 및 활용사례
- 최초 등록일
- 2014.06.26
- 최종 저작일
- 2014.06
- 6페이지/ 한컴오피스
- 가격 2,500원
목차
I. 대용량의 문서(Text) 데이터에서 의미 있는 정보를 찾아내는 기술, Text Mining 의 개요
가. 텍스트 마이닝의 정의
나. 텍스트 마이닝의 등장 배경
II. 텍스트 마이닝 프로세싱과 전처리 작업 및 적용 기술
가. 텍스트 마이닝 프로세스
나. 텍스트 전처리 작업(Text Processing)
다. 텍스트 마이닝 적용 기술
III. 텍스트 마이닝과 데이터 마이닝 비교
1. 텍스트 기반의 문서 마이닝, 텍스트 마이닝의 이해
가. 텍스트 마이닝(Text Mining)의 정의
2. 텍스트 마이닝의 요소기술 및 프로세스
3. 텍스트 마이닝의 활용분야 및 적용시 고려사항
Ⅳ. 추가자료
Ⅴ. 국내 적용사례
본문내용
가. 텍스트 마이닝의 정의
- 대용량의 데이터에서 사용자가 관심을 가지는 정보를 찾아 내는 프로세스
- 비/반정형 데이터에 대하여 자연어 처리(Natural Language Processing) 기술과 문서처리 기술을 적용하여 유용한 정보를 추출, 가공하는 기술
나. 텍스트 마이닝의 등장 배경
- 기업, 학교, 연구소등에서 생성, 저장, 재사용되는 데이터들은 2:8의 비율로 정형화된 데이터와 비정형화된 데이터로 구분되며 80%에 이르는 비정형화된 데이터로부터 유용한 정보를 추출하고 가공하는 기술이 필요하게 됨에 따라 등장
<중 략>
가. 텍스트 마이닝의 요소기술
-정보 인출/추출 : 텍스트 문서에서 사용자가 원하는 정보 추출
-텍스트 분석 : 문서분류, 군집화, 정보발췌, 특성발췌
-Topic Tracking : 사용자 profile기반으로 사용자가 관심 있어하는 문서를 예측
-Question & Answering(NLP) : 사용자가 자연어로 질문하고 답을 제공
나. 텍스트 마이닝의 프로세스
정보검색
-작업에 관련된 문서의 위치를 파악하고 검색
-관련 없는 문서를 제거하는 시스템이 필요
정보추출
-선택된 문서로부터 정보를 추출
-기대되는 정보에 대한 사용자 정의의 Template를 충족
정보마이닝
-각 문서에 대한 Template이 충족되면 일반 데이터 마이닝 기법 적용이 가능한 데이터베이스를 갖게되며 데이터 내의 패턴을 찾아냄
정보해석
-마이닝 단계로부터 발견된 패턴을 해석
<중 략>
문서군집은 각 지식 콘텐트의 특성을 파악해 그 내용 혹은 형태가 유사하거나 상호 관련성이 높은 콘텐트들을 군집시켜 주는 기술이다. 사용자는 문서군집 기술을 통해, 관심 있는 문서들을 그 관련도 순으로 한꺼번에 묶어서 효과적으로 검토해 볼 수 있을 뿐만 아니라, 예제 기반 질의를 통해, 방대한 문서 속에 숨겨져 있는 정보에 매우 빠르고 쉽게 접근하는 것이 가능해진다. 통상의 문서군집 기술은 대상 문서의 언어학적 분석을 통해 차별화된 중요 특성들을 추출해 내고, 이를 다른 문서의 특성들과의 비교(유사도 계산)하여 그 유사도가 높은 문서들을 상호 묶어주는 방식으로 구현된다.
참고 자료
없음