java로 검색엔진 구현하기 ( 컴퓨터 알고리즘 수업 프로젝트 ) _ report
- 최초 등록일
- 2011.05.20
- 최종 저작일
- 2007.07
- 33페이지/ 한컴오피스
- 가격 2,500원
소개글
"java로 검색엔진 구현하기 ( 컴퓨터 알고리즘 수업 프로젝트 )"로 올린
소스코드의 보고서입니다.
목차
없음
본문내용
먼저 검색을 하기 전에 효율적인 검색을 하기 위하여 모든 파일들은 읽어들여서 검색하기 좋은 구조로 표현해 놓는다. 읽어들인 파일들의 정보를 저장한 노드들로 리스트를 생성한다. 그리고 검색을 하는 경우 파일의 제목에 검색 키워드가 존재하는 파일들을 빠르게 찾기 위하여 "파일 제목 토큰 리스트"를 생성한다. 그리고 해당하는 파일의 본문은 검색 키워드에 대해 얼마나 일치하는지를 위한 수치값을 계산하기 위하여 "파일 본문 토큰 리스트"를 생성한다.
<검색과정>
1. 사용자가 검색 키워드를 입력
2. 파일 제목 토큰 리스트에서 검색 키워드를 가진 파일들의 주소 리스트를 얻는다. 이 주소 리스트에 있는 파일들은 파일 제목에 검색 키워드를 가진 파일들이다.
3. 이 리스트에 있는 파일들의 본문 토큰 리스트로 이동한다.
4. 이 각 파일들의 본문 토큰 리스트에서 검색 키워드를 찾는 과정이 시작된다.
5. 검색 키워드와 동일한 알파벳으로 시작하고 길이가 검색 키워드와 동일하거나 긴 본문 토큰이 저장된 리스트로 이동한다.
6. 이 본문 리스트에서 검색 키워드와 일치하거나 혹은 검색 키워드가 포함되는 노드들을 모두 찾는다.
7. 먼저 이 노드의 count는 현재 본문에서 이 노드의 token 빈도수를 저장하고 있기 때문에 count*(검색 키워드의 길이)를 하게 되면 일단 본문 가중치의 일부가 계산된다. (본문 노드의 token들은 검색 키워드와 일치하거나 혹은 검색 키워드를 포함하는 경우를 의미 있다고 판단하여 검색을 성공했다고 판단한다.)
8. 파일의 제목에 검색 키워드가 들어있는 본문들의 가중치를 비교해서 정렬하고 상위 5개의 파일들을 사용자에게 보여준다.
*위의 까지의 과정들은 우선순위 4와 3의 경우에 해당하는 경우로 사용자가 원하는 정보와 가장 많이 근접하다고 생각되는 파일들을 출력해주는 단계이다.
참고 자료
없음