Improving Web Spam Classifiers Using Link Structure 한글번역 및 ppt
- 최초 등록일
- 2011.07.29
- 최종 저작일
- 2010.10
- 12페이지/ 압축파일
- 가격 2,000원
소개글
Improving Web Spam Classifiers Using Link Structure 논문의 한글번역 및
목차
없음
본문내용
1. 도입
웹상의 페이지수가 수도 없이 많아짐에 따라, 많은 사용자들은 웹 리소스를 찾기 위해 검색 엔진을 사용합니다. 검색 결과의 상위 페이지는 상업 웹 사이트들에게 있어선 놓칠 수 없는 포지션입니다. 검색 엔진 랭킹을 조작하여 실제보다 더 상위의 검색 페이지 위치를 얻는 것을 검색 엔진 스패밍이라고 일컫습니다. 이는 검색 결과의 정확도를 저하시킬 뿐만 아니라, 크롤링, 인덱싱, 그리고 저장 비용의 증가를 불러일으킵니다.
현재 웹 상에선 [12]에서 묘사된 것과 같이 다양한 스팸 테크닉이 존재하고 있습니다. 여기서 우린 컨텐츠 스팸과 링크 스팸이라는 두 개의 주요 카테고리로 나뉘는 스팸 기술에 대해 논할 것입니다. 근래 들어 방대한 분량의 작업이 웹 스팸에 집중하여 링크 분석 방법과 머신 학습 기반 분류 방법을 이용한 스팸 걸러내기 등에 대한 많은 연구가 진행되었습니다. 예를 들어, 링크를 리버싱함으로서 알려진 스팸 페이지로에 대한 불신을 퍼뜨리는 방식[19]은 몇몇 검색 엔진이 사용했다고 알려졌으며, [13]은 스팸을 걸러내기 위해 양질의 사이트에 대한 신뢰성을 홍보하는 아이디어입니다. 스팸 페이지의 통계학적 속성에 대한 연구는 [11]에서처럼 스펨 페이지가 일반적으로 비스팸 페이지와 기능의 수에 있어 차이가 난다는 것을 밝혔습니다. 그리고 이는 [16]의 스팸을 찾아내는 Classifier를 구축하는 데 사용되었습니다. 최근의 몇몇 작업 결과는 인-디그리와 아웃-디그리 분배 등의 링크 기반 기능을 Classifier에 합병함으로써 스팸 발견 기능을 강화했습니다. 예를 들어, 스팸랭크 알고리즘은 [3]에서처럼 페이지랭크 값 분배를 Classification의 기능과 같이 사용함으로써 활용할 수 있습니다.
참고 자료
없음
압축파일 내 파일목록
Improving Web Spam Classifiers Using Link Structure 002.pptx
Improving Web Spam Classifiers Using Link Structure.docx
Improving Web Spam Classifiers Using Link Structure 001.pptx