소개글
이거 만드느라 정말 힘들었습니다. 대학생임에도 불구하고 대학원 논문까지 뒤적일만큼.. T.T 힘들었던 만큼 좋은 자료라고 생각합니다.목차
1. 도입 및 동기1.1 검색 품질의 개선
1.2 웹 페이지 중요성의 객관화
2. 페이지 랭크(Page Rank)의 기본 알고리즘
2.1 페이지 랭크(Page Rank)의 기본 수식
2.2.1 페이지 랭크(Page Rank) 알고리즘 방정식으로 얻기
2.2.2 페이지 랭크(Page Rank) 알고리즘 고유벡터로 얻기
2.3 페이지 랭크(Page Rank)수식의 보완
3. 페이지 랭크를 이용한 검색
3.1 제목을 이용한 검색
3.2 모든 내용을 이용한 검색
4. 페이지랭크 구현을 위한 기술들
4.1 연결 URL 추출
4.2 URL/문서번호변환
4.3 상대/절대 URL 변환
4.4 대/소문자 구분
5. 페이지랭크 알고리즘 적용 시스템(LAS : 연결분석시스템)
6. 다른 검색 엔진과의 비교
6.1키워드 검색방법 비교
6.2이미지 검색방법 비교
7. 구글(Google)의 상업적 이익
7.1 스폰서를 이용한 이익
7.2 구글(Google)의 기술 대여
7.3 주식을 통한 이익
8. 구글(Google)의 허점
9. 결론
참고 문헌 및 사이트
본문내용
1. 도입 및 동기처음에 인터넷을 접했을 때만 해도 윈도우3.1에서 넷츠케이프 홈페이지를 완전히 불러 올 때까지 15분이나 소모 되었던 때만 해도 한글화된 인터넷 홈페이지는 얼마 있지도 않았었습니다. 그 후 얼마 지나지 않아 케이블 모뎀이 처음 등장했을 때도 보급화 하는데 상당히 오랜 시간이 걸릴 줄 알았습니다. 하지만 지금은 거의 모든 가정에 초고속인터넷이 설치 되어 있고 무선인터넷을 통하여 PDA나 노트북 등을 이용하여 어디에서나 인터넷을 사용할 수 있게 되었습니다. 이렇게 인터넷의 보급과 성장이 빠른 만큼 웹의 크기도 기하급수적으로 커지고 있고 다양해지고 있습니다. 불과 처음 인터넷이 보급 되었을 당시만 하더라도 찾고 싶은 정보가 있어도 인터넷에 내가 찾는 정보가 없는 경우가 많았으나 지금은 웹이 너무나 거대해 져서 찾고 싶은 정보가 있어도 그 정보에 대한 질문을 입력 하였을 때 너무나 많은 자료가 나와서 그 안에서 내가 찾는 정보를 다시 찾아야만 하는 어려움이 생겼습니다. 특히 최근에는 검색 엔진의 순위매기는 기능을 이용하여 개인적인 이익을 얻으려는 문제들이 많이 발생하고 있습니다. 이러한 기존의 문제들을 보안하고 초보자도 쉽게 중요하고 정확한 정보를 얻을 수 있게 하고자 개발된 방법이 페이지랭크(Page Rank)입니다.
1.1 검색 품질의 개선
페이지 랭크(Page Rank)의 주된 목표는 웹 검색 엔진의 질적인 면을 개선하고자 하는 것입니다. 초기에는 완전한 검색 엔진 색인화를 통해서 어떠한 정보라도 쉽게 찾을 것이라고 생각했었지만 최근 검색 엔진을 사용해 보면 쓰레기 검색 결과(Junk results)들이 원래 내가 찾고자 했던 검색 결과를 압도하는 경우를 자주 볼 수 있습니다. 심지어 어떠한 검색 엔진에서는 그것의 서비스를 조회했음에도 불구하고 상위 검색 결과 안에 그 결과가 나오지 않는 경우도 많이 발생합니다. 웹상의 문서는 기하급수적으로 증가하고 있지만 사용자들은 검색되어 나온 결과 중 수십 개 정도만 찾으려 합니다. 페이지 랭크(Page Rank)는 이러한 검색 품질의 질을 개선 하고자 한 방법입니다.
참고 자료
(1) 허명회, [행렬의 이해와 계산], 제1판1쇄, 자유아카데미, 1995, p.12~15, p.35~38, p.53~56(2) 김성진∙이상호∙방지환, [페이지랭크 알고리즘 적용을 위한 구현 기술], 숭실대학교, 2002
(3) 이우기, [Link Oriented Web Structure Mining], 성결대학교, 2004
(1) 자동화기술연구정보센터
http://icat.snu.ac.kr:3000/numerical_analysis/text/chap1_3.html
(2) Kwon3D http://kwon3d.com/korean/theory/vectmat.html