[데이터 마이닝]데이터 마이닝
- 최초 등록일
- 2005.11.24
- 최종 저작일
- 2004.11
- 66페이지/ 한컴오피스
- 가격 2,000원
소개글
학부 졸업 논문입니다.
데이터 마이닝에 대한 모든 내용이 정리되어 있어서
데이터 마이닝에 대해 레포트 쓰거나 논문 써야 하는 분들 많은 도움 될 것입니다.
목차
서론
연구배경 및 내용
본론
1. 데이터 마이닝의 필요성과 발전 배경
2. 데이터마이닝의 정의
3. 데이터마이닝 프로세스
4. 데이터마이닝의 활용
5. 데이터마이닝 기법
6. 데이터 마이닝 관련기술
7. 데이터 마이닝 사례연구
본문내용
그러나 수많은 이메일 계정을 가진 스패머와 고정IP보다는 유동적인 가상IP를 많이 사용하는 현실에서 최적의 대응이 어렵다. 잘못하면 선의의 피해자가 발생할 수도 있고 꼭 받아야하는 이메일을 받지 못하는 경우가 발생하기 때문이다.
이번 연구에서는 데이터마이닝 기법을 이용해 스팸메일 필터링 모형을 구축하였다. 분류 및 예측에 유용한 기법들인 인공신경망과 의사결정나무분석의 기법을 적용해 본 결과, 인공신경망이 평균 84.94%, 의사결정나무가 평균 88.34%로 둘다 우수한 예측력을 보여 주었다. 특히 의사결정나무분석은 얻어진 결과에 대한 계층구조를 보여줌으로써 결과에 대한 설명력에 있어서 우수하였다.
그러나 이번 연구는 다음과 같은 한계를 지닌다. 첫째, 이번 연구에서 사용된 데이터가 영문 이메일 데이터라는 점으로, 향후 국문 이메일에도 적용가능한 모형의 구축이 필요하리라고 본다. 둘째, 이번 연구에서 제시된 모형의 적중률이 100%가 아닌이상, 모형 적용 시 중요한 메일을 스팸으로 오인할 가능성이 존재한다는 점이다.
스팸 필터링 모형과 같이 1종 에러와 2종 에러로 인한 비용이 크게 상이한 경우, cut-off의 조정을 통하여 오분류비용(mis-classification cost)를 최소화 시켜야 한다. 이 문제는 본 모형을 적용하는 조직의 특성과, 오분류 비용 최소화를 위한 최적화와 관련된 연구를 통하여 해결하여야 할 것이다.
참고 자료
Seidman, Claude (2001), (Microsoft SQL Server 2000)데이터 마이닝 : SPSS 아카데미
최종후, (1999), 데이터마이닝:기능과 사용법 : 자유아카데미
김지현 (1999), 데이터마이닝의 의사결정나무분석을 이용한 사례분석 :이화여자대학교 대학원 석사학위 논문
최종후 (1998), (Answer tree를 이용한)데이터마이닝 의사결정나무분석 : 고려정보산업
박원환 (2001), 수량 연관규칙을 위한 데이터마이닝 알고리즘에 관한 연구 : 순천대학교 대학원 석사학위논문
김미연 (2000), 개선된 연관규칙 알고리즘 개발에 관한 연구 : 연세대학교 대학원 석사학위논문
이혜명 (2001), 점진적 프로잭션 기반의 고차원 데이터 클러스터링 기법 : 명지대학교 대학원 석사학위논문
안수산 (2001), 데이터마이닝 기법을 활용한 스팸메일 분류 및 예측모형 구축에 관한 연구 : 이화여대 경영 대학원 석사학위논문
류정민 (2002), 인터넷 신문사이트 접속자의 채널 이동 유형 분석에 관한 연구 : 서울시립대 대학원