java로 검색엔진 구현하기 ( 컴퓨터 알고리즘 수업 프로젝트 ) _ report

*예*

개인인증 판매자스토어

최초 등록일: 2011.05.20
최종 저작일: 2007.07; 33페이지/ 한컴오피스; 가격 2,500원

다운로드

장바구니

상세정보
자료후기 (0)
자료문의 (0)
판매자정보

소개글

"java로 검색엔진 구현하기 ( 컴퓨터 알고리즘 수업 프로젝트 )"로 올린
소스코드의 보고서입니다.

본문내용

먼저 검색을 하기 전에 효율적인 검색을 하기 위하여 모든 파일들은 읽어들여서 검색하기 좋은 구조로 표현해 놓는다. 읽어들인 파일들의 정보를 저장한 노드들로 리스트를 생성한다. 그리고 검색을 하는 경우 파일의 제목에 검색 키워드가 존재하는 파일들을 빠르게 찾기 위하여 "파일 제목 토큰 리스트"를 생성한다. 그리고 해당하는 파일의 본문은 검색 키워드에 대해 얼마나 일치하는지를 위한 수치값을 계산하기 위하여 "파일 본문 토큰 리스트"를 생성한다.

<검색과정>
1. 사용자가 검색 키워드를 입력
2. 파일 제목 토큰 리스트에서 검색 키워드를 가진 파일들의 주소 리스트를 얻는다. 이 주소 리스트에 있는 파일들은 파일 제목에 검색 키워드를 가진 파일들이다.
3. 이 리스트에 있는 파일들의 본문 토큰 리스트로 이동한다.
4. 이 각 파일들의 본문 토큰 리스트에서 검색 키워드를 찾는 과정이 시작된다.
5. 검색 키워드와 동일한 알파벳으로 시작하고 길이가 검색 키워드와 동일하거나 긴 본문 토큰이 저장된 리스트로 이동한다.
6. 이 본문 리스트에서 검색 키워드와 일치하거나 혹은 검색 키워드가 포함되는 노드들을 모두 찾는다.
7. 먼저 이 노드의 count는 현재 본문에서 이 노드의 token 빈도수를 저장하고 있기 때문에 count*(검색 키워드의 길이)를 하게 되면 일단 본문 가중치의 일부가 계산된다. (본문 노드의 token들은 검색 키워드와 일치하거나 혹은 검색 키워드를 포함하는 경우를 의미 있다고 판단하여 검색을 성공했다고 판단한다.)
8. 파일의 제목에 검색 키워드가 들어있는 본문들의 가중치를 비교해서 정렬하고 상위 5개의 파일들을 사용자에게 보여준다.

*위의 까지의 과정들은 우선순위 4와 3의 경우에 해당하는 경우로 사용자가 원하는 정보와 가장 많이 근접하다고 생각되는 파일들을 출력해주는 단계이다.

참고 자료

없음

이 자료와 함께 구매한 자료

해쉬테이블을 이용한 도서관리 프로그램 0페이지
hash 구현 프로그램 0페이지
[자바 소스]자바로 만든 간단한 dictionary 사전 0페이지
[자료구조][대학 리포트] C로 구현한 해쉬 소스(HASH : 해시) 0페이지
키워드 검색 엔진 구현 19페이지

주의사항

환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류	중복자료	저작권 없음	설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우	다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함)	인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우	자료의 설명과 실제 자료의 내용이 일치하지 않는 경우