BRONZE
BRONZE 등급의 판매자 자료

문헌 클러스터링

자동분류의 두 개의 범주인 클러스터링과 범주화(categorization) 중 클러스터링에 관한 내용 정리
14 페이지
한컴오피스
최초등록일 2015.10.09 최종저작일 2015.08
14P 미리보기
문헌 클러스터링
  • * 본 문서는 한글 2005 이상 버전에서 작성된 문서입니다. 한글 2002 이하 프로그램에서는 열어볼 수 없으니, 한글 뷰어프로그램(한글 2005 이상)을 설치하신 후 확인해주시기 바랍니다.

    미리보기

    소개

    자동분류의 두 개의 범주인 클러스터링과 범주화(categorization) 중 클러스터링에 관한 내용 정리

    목차

    1. 자동분류 개요
    2. 문헌 클러스터링 개요
    3. 문헌 간 유사도 측정
    4. 클러스터링 기법
    5. 계층적 클러스터링
    6. 클러스터 유사도 산출방법
    7. 비계층적 클러스터링
    8. 비계층적 알고리즘
    9. 클러스터링의 타당성 및 성능평가

    본문내용

    자동분류(automatic classification)란 분류 알고리즘에 의해 대상물(object, items)들을 유사한 패턴을 갖는 것끼리 모아 집단화하는 작업을 말한다. 자동분류의 대상물과 목적은 적용 분야에 따라서 다양한데, 정보검색 분야에서는 주로 문헌이나 용어가 분류 대상물이 된다. 문헌의 자동분류는 유사한 내용의 문헌들을 미리 집단화함으로써 검색을 용이하게 하려는 목적을 갖고 있으며, 용어의 자동분류는 용어 클래스들을 생성함으로써 자동 시소러스를 작성하거나 또는 검색 시 질의어와 유사한 용어 클래스의 다른 용어들을 질의에 추가함으로써 검색 성능을 향상시키려는 목적을 갖고 있다.

    문헌의 자동분류에 대한 연구는 1960년대에 시작되어 1980년대까지는 실험적인 수준을 벗어나지 못하였으나, 1990년대 이후 컴퓨터 처리 능력이 급격히 발전하고 웹 환경으로 인해 접근 가능한 정보가 폭발적으로 증가함에 따라 관련 연구가 크게 활성화되고 있다.

    문헌의 자동분류는 사전(a priori) 분류체계의 활용 여부에 따라 두 가지 유형으로 구분된다(Dattola 1969). 첫째는 사전 분류체계가 없이 문헌 간의 유사성에 근거하여 유사한 내용의 문헌들의 집단을 형성하는 문헌 클러스터링(document clustering)이며, 둘째는 기계학습(machine learning) 방법에 의해 각 문헌을 사전 분류체계의 가장 적절한 주제범주에 배정하는 텍스트 범주화(text categorization)이다.
    텍스트 범주화는 각 범주를 대표하는 이름(class label)과 학습 데이터를 사용하므로 지도학습(supervised learning) 분류라고 하며, 문헌 클러스터링은 학습 데이터(training data)를 필요로 하지 않으므로 비지도 학습(unsupervised learning) 분류라고 한다(Manning and Schutze 1999).
    텍스트 범주화에서는 문헌과 사전 분류범주와의 유사도를 계산하여 문헌에 유사도가 가장 큰 상위 n개의 분류범주에 중복적으로 배정할 수 있지만, 문헌 클러스터링은 중복분류를 허용하지 않는다(노정순, 2011).

    참고자료

    · 없음
  • 자료후기

    Ai 리뷰
    지식판매자가 등록한 자료는 과제에 직접 활용할 수 있는 유용한 내용이 많아, 큰 도움이 되었습니다. 앞으로도 계속 좋은 자료 부탁드립니다! 감사합니다.
    • 자주묻는질문의 답변을 확인해 주세요

      해피캠퍼스 FAQ 더보기

      꼭 알아주세요

      • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
        자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
        저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
      • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
        파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
        파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

    찾으시던 자료가 아닌가요?

    지금 보는 자료와 연관되어 있어요!
    왼쪽 화살표
    오른쪽 화살표
    문서 초안을 생성해주는 EasyAI
    안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
    저는 아래와 같이 작업을 도와드립니다.
    - 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
    - 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
    - 스토어에서 무료 캐시를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
    이런 주제들을 입력해 보세요.
    - 유아에게 적합한 문학작품의 기준과 특성
    - 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
    - 작별인사 독후감
    해캠 AI 챗봇과 대화하기
    챗봇으로 간편하게 상담해보세요.
    2025년 05월 30일 금요일
    AI 챗봇
    안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
    6:57 오후