[데이터마이닝]SaS 실습예제 데이터마이닝 E-miner
- 최초 등록일
- 2006.06.15
- 최종 저작일
- 2006.06
- 6페이지/ 한컴오피스
- 가격 1,000원
소개글
※ SAS-Enterprise Miner 실습 입니다...
A+받은 레포트입니다...ㅎㅎ
목차
없음
본문내용
※ SAS-Enterprise Miner 실습
① Classification
- Tree(entropy based and regression based) 예제
② Raw Data
- HMEQ data
- UCI machine learning data repository에서 발췌, 데이터 마이닝분야 및 통계분야에서 사용되는 신용평가 data set
- 구성 : 5960 records
<데이터셋 일부>
③ Input node 와 Insight node, Tree node, Regression node, Assessment node 로 모델링한 모습
1) Input node 및 Insight node를 통한 Bad 변수의 분포 확인
- Class label인 Bad( type: binary )의 모델 역할에 target으로 설정함
2) Tree node 에서의 옵션 설정
- 분류 기준 및 분류 레벨, 분지 가지의 수 등을 설정해준다.
- 여기서는 Entropy based reduction을 기본으로 수행함.
3) Regression node 에서의 옵션 설정
- Target variable이 binary 이므로 logistic regression check 및 link function은 logit으로 설정함.
④ Results
1) Tree 수행의 결과
- 위의 트리를 확인하면 level 4 의 depth로 DEBTINC, VALUE, DELINQ 순으로 분지가 되어 있음을 확인할 수 있다.
- 수입에 대한 부채 비율이 44.8 이상이고 부실거래의 수가 0.5 이상이면 대출금 상환여부가 0 일 비율이 35.%로 높음을 확인할 수 있다.
2) Regression 수행의 결과
- Regression의 수행 결과이다. Stepwise selection을 통한 분석이었으며, Target에 영향을 주는 유의한 변수로서 DELIQ, DEBTINC, DEROG, CLASE 가 선택되었음을 확인 할 수 있다.
참고 자료
없음