perl을 이용한 검색엔진 시스템 구현
- 최초 등록일
- 2007.12.23
- 최종 저작일
- 2007.11
- 19페이지/ 압축파일
- 가격 3,000원
소개글
perl 언어를 이용하여 검색엔진 시스템을 구현하였습니다.
목차
1. 중간 보고서
2. 최종 보고서
3. 소스파일
본문내용
1. 서 론
1.1. 검색엔진의 필요성 및 중요성
Web은 인터넷에서 급속도로 성장하여 1,000만 사용자를 넘고 있으며, 몇 개월 만에 그 수는 배로 늘고 있다. 현재 유비쿼터스 시대를 지향하게 되면서 Web은 가상공간뿐만이 아니라 우리가 사는 공간 어디서나 항상 존재하는 필수적인 요소가 되었다.
HTML은 인터넷 제작의 표준이다. HTML은 쉽게 만들 수 있고 세계의 다른 정보와 연결이 가능하다. 많은 회사나 단체, 개인이 Web에서 홈 페이지나 기타 서비스를 제공하고 있다. 그리고 지금은 HTML 뿐만 아니라, 그 이상의 기술로 된 Web의 숫자가 늘고 있다. 직업을 찾는다든지 티켓 구입, 상품의 원격 구매 등 Web을 만들고, DB를 검색하고 자료를 입력하는 귀찮고 힘든 작업이 될 수도 있는 이런 일을 수행하는 전문적인 프로그램 역할을 하는 Web들이 필요하게 되었다.
1.2. 기술의 개요 및 우수성
검색엔진의 정보구축방법 - www에 있는 정보는 스파이더, 로봇, 크롤러, 웜이라고 불리는 프로그램을 통해 수집된다.
- 로봇프로그램 또는 자료정리 프로그램은 키워드 검색에 사용할 수 있도록 웹문서의 내용을 색인화(index)화 하는 역할을 수행한다.
- 이렇게 색인화 된 정보는 사용자가 원하는 것을 찾아볼 수 있도록 데이터베이스로 구축된다. 즉, 로봇은 웹에 있는 정보를 수집하고 분류하여 색인화한 다음 이를 데이터베이스로 구축하는 작업을 한다. 첫눈의 SnowRank 검색기술- NHN이 보유한 검색기술은 컨텐츠가 상대적으로 적은 한국 인터넷 상황에 적합하지만 컨텐츠가 무한정으로 늘어나는 영어권 인터넷에 약하다. 하지만 구글이나 첫눈의 검색기술은 인터넷에서 찾을 정보량이 많으면 많을수록 효율성이 높아지는 특징이 있어 해외시장 진출용에 적합하다고 한다.
- 첫눈은 내부 DB를 구축하지 않고 인터넷 전체를 대상으로 검색하는 ‘바다 정책’을 사용한다. 그리고 중복으로 찾는 단어가 의미 있다는 SnowRank 검색 기술 등 새로운 인터넷 검색 패러다임을 들고 나섰다. 즉 검색어별로 웹문서가 중복된 정도 및 최근 시점을 바탕으로 정보를 추출해 검색 순위를 결정하는 독특한 알고리즘을 따른다. Google은 첫눈의 기술과 비슷하나 최신성 순서대로 검색결과를 랭킹하는 것이 아니라 랭크 빈도가 높은 웹문서를 먼저 보여주는 페이지 링크 방식을 통해 검색 순위를 결정한다.
참고 자료
[1] Perl 5를 이용한 CGI 프로그래밍 60분 가이드, Robert Farrell
[2] Perl 5로 배우는 CGI 프로그래밍, Eric Hermann
[3] 네이버 지식인
[4] C로 구현한 알고리즘, O`Reilly
[5] http://www.cpan.org/ Comprehensive Perl Archive Network
[6] http://perlmania.or.kr/ Perl Mania
[1] Perl 5를 이용한 CGI 프로그래밍 60분 가이드, Robert Farrell
[2] Perl 5로 배우는 CGI 프로그래밍, Eric Hermann
[3] 네이버 지식인
[4] C로 구현한 알고리즘, O`Reilly
압축파일 내 파일목록
인쏘기말보고서.hwp
인터넷소프트웨어Coding.hwp
인터넷소프트웨어_5조_중간보고서[1].hwp