• LF몰 이벤트
  • 파일시티 이벤트
  • 서울좀비 이벤트
  • 탑툰 이벤트
  • 닥터피엘 이벤트
  • 아이템베이 이벤트
  • 아이템매니아 이벤트

질문 유형에 따른 검색엔진의 성능 비교

*민*
최초 등록일
2009.12.02
최종 저작일
2009.11
24페이지/한글파일 한컴오피스
가격 3,000원 할인쿠폰받기
다운로드
장바구니

소개글

언어학 혹은 공학에 관련하여
인터넷 검색엔진을 성능 비교하였습니다.
다양한 척도로 비교 하였습니다.

목차

1. 문제 제기

1.1. 연구의 목적 및 필요성

2. 실험 설계

2.1. 검색엔진 선정
2.2. 질문의 유형
2.2.1. 질문의 유형의 구분
2.2.2. 질문 작성
2.3. 검색결과 실험 평가 방법

3. 실험 결과 분석

3.1. 질문의 길이에 따른 성능 비교분석
3.2. 최신성의 여부에 따른 성능 비교분석
3.3. 복합명사의 포함 여부에 따른 성능 비교분석
3.4. 고유명사의 포함 여부에 따른 성능 비교분석
3.5. 중의적 단어의 중의적인 의미들의 출현빈도에 따른 성능 비교분석

4. 결론 및 시사점

5. 참고문헌

본문내용

1.1 연구의 목적 및 필요성

인터넷과 더불어 정보의 양이 급증하고 정보에 대한 요구 형태가 다양해지면서 정보검색에 관한 관심은 폭팔적으로 증가하고 있습니다. 정보검색 기술은 90년대 후반부터 인터넷의 발전과 더불어 상업적 응용이 확대되면서 급속히 발전하고 있고, 현재까지 정보검색의 발전은 단어에 대한 통계적인 모델을 기반으로 이루어졌습니다. 텍스트, 문장, 문장 구성 성분이 가지고 있는 의미가 명시적으로 분석, 표현되어 사용되기 보다는 통계적인 방법으로 정보검색에서 비슷한 효과를 얻으려고 노력하고 있습니다. 즉 인터넷 검색 엔진은 인터넷에 등록된 제반 정보를 미리 수집하여 이를 테이터베이스를 구축하고 체계적으로 저장한 후 원하는 정보를 이용자에게 제공하는 테이터베이스 시스템을 가진 것입니다. 이와 같은 시스템은 검색 방식에 따라서 주제별 검색, 단어별(키워드형) 검색, 메타(멀티쓰레드형, 지능형) 검색, 하이브리드형 검색으로 구분됩니다. 현재 대부분의 검색엔진들은 주제별 검색과 키워드 검색을 동시에 하는 하이브리드형 검색을 하고 있습니다.
위와 같은 검색 방식에도 불구하고, 웹 문서의 양이 급격히 증가하면서 대용량 문서 색인 기술과 함께 수만에서 수십만의 검색 결과 중에서 사용자가 원하는 의도에 맞는 정보를 정확하게 찾아주는 효과적인 검색 기술이 요구 됩니다. 특히 웹과 같은 영역에서의 정보검색은 다양한 분야의 정보들이 서로 연결되어 있는 상황에서 빠르고 정확하게 찾아주는 점에 초절을 맞추어 기술 개발이 집중적으로 이루어지고 있습니다.
그러나 그림 [1]은 사례와 같이, 모든 정보검색 시스템들은 검색 결과에 원하지 않는 문서가 포함되어 있습니다. 이용자가 같은 검색어를 사용했음에도 불구하고, 검색엔진마다 검색 결과는 다른 결과를 보여줍니다, 이러한 문제점의 근본적인 원인은 크게 두 가지로 볼 수 있습니다. 첫째는 시스템이 검색에 사용하는 질의가 사용자의 정보 요구를 제대로 표현하지 못하는 것이고, 둘째는 검색엔진의 색인 과정의 문제 때문입니다.

참고 자료

강범모. (2003). 컴퓨터를 이용한 국어 분석의 기초와 이론. 언어, 컴퓨터, 코퍼스 언어학 (pp. 112-153). 서울: 고려대학교 출판사.
김강현. (2004). 형식문법. 컴파일러구성 (pp. 123-134). 서울: 한국방송통신대학교 출판부.
강승식 · 김영택. (1992). 한국어 형태소 분석기에서 불규칙 용언의 분석 모형. 한국정보과 학회 논문집, 19(2), 151-164.
김덕봉 · 최기선 · 강재우. (1990). 한국어 형태소 처리와 사전: 접속 정보를 이용한 한글 철자 및 띄어쓰기 검사. 어학연구, 26(1), 87-113.
김동주. (2007). 단어의 통사분석을 위한 계산모형. 박사학위논문, 한양대학교 대학원, 서울.
강신재. (2004). 온톨로지 구축 및 단어 의미 중의성 해소에의 활용. 한국정보처리학회논문 집. 11(4), 3-21.
김수경 · 안기홍. (2007). 지능형 이미지 검색 시스템을 위한 추론 기반의 웹 온톨로지 구 축. 정보관리학회지, 24(3) 119-147.
김영정. (1996). 컴퓨터-번역, 비평, 창작 기계로서의 가능성. 심리철학과 인지과학 (pp. 184-214). 서울: 철학과 현실사.
김원경. (2007). 의미격의 체계와 연산절차. 한국어 의미학, 24, 103~129.
김창기. (1991). 한국어 이해에 나타나는 중의성 문제 처리 모델에 관한 연구. 정보관리학회 지, 14(1), 107-124.
나동렬. (1994). 한국어 파싱에 대한 고찰. 정보학회지 12(8). 41-54.
남기심, 고영근. (2004). 표준국어문법론. 서울: 탑 출판사.
남영준. (1996). 코퍼스를 이용한 정보 검색용 전자사전 구축에 관한 연구. 한국정보과학회 언어공학연구회 학술발표 논문집, 2, 430-440.

외..
*민*
판매자 유형Bronze개인

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

더보기
최근 본 자료더보기
탑툰 이벤트
질문 유형에 따른 검색엔진의 성능 비교 무료자료보기
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업
  • 레이어 팝업