• 캠퍼스북
  • LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

Introduction to Information Retrival(챕터4)

*학*
최초 등록일
2011.07.24
최종 저작일
2010.01
11페이지/파워포인트파일 MS 파워포인트
가격 1,000원 할인쿠폰받기
다운로드
장바구니

소개글

Introduction to Information Retrival 챕터정리 ppt

목차

4. Index construction
4.1 Construction of large indexes
4.2 Distributed indexing
4.3 Dynamic indexing
4.4 Other types of indexes

본문내용

4.1 Construction of large indexes

최근 사용되는 대용량 데이터들은 메모리만으로 정렬하는데 문제가 있음.

메모리가 부족할 경우 디스크를 이용할 수 있다. 하지만 속도가 느려진다.

해결책은 블록병합알고리즘 : 빠르지만 빈약한 메모리와 느리지만 방대한 디스크간의 효율적인 교환을 성사시킴.

만약 포스팅 파일의 크기가 가용 메모리의 소형 팩터 안에 있다면, 압축 기술이 도움될 것입니다. 하지만 많은 대형 모음의 포스팅 파일은 압축 과정을 거친 후에도 메모리 안에 담을 수 없다.

일정하게 정해진 사이즈의 블록이 꽉 찰 때까지 포스팅을 메모리에 termID-docID쌍으로 정렬.

인버트 인덱스를 만들기 위해 정렬하여 디스크에 저장

디스크에 저장된 모든 데이터를 하나의 인덱스로 통합.

모든 블록파일을 동시에 열고 읽기와 최종 병합인덱스에 쓰기 위한 버퍼 유지.

각 블록의 다음 아이템은 버퍼를 이용해서 고르고 우선순위 설정을 사용하여 다음 포스팅을 설정

참고 자료

없음

이 자료와 함께 구매한 자료

*학*
판매자 유형Bronze개인

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

최근 본 자료더보기
탑툰 이벤트
Introduction to Information Retrival(챕터4)
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업