[데이터마이닝] 데이터마이닝-연관규칙기법

등록일 2003.07.02 한글 (hwp) | 7페이지 | 가격 500원

목차

1.연관규칙 정의
2.연관규칙 예
3.연관규칙 측정
4. -참고:군집화
5.연관규칙 알고리즘

본문내용

- 연관성측정(Associations)은 어떤 특정 문제에 대해 아직은 일어나지 않은 답(예를 들어, 부도․건전)을 얻고자 하는 예측(Prediction)의 문제나 고객들을 특정목적에 따라 분류(Segmentation)하는 문제가 아니라, 상품 혹은 서비스(이하 상품)의 거래기록(Historical)데이터로부터 상품간의 연관성 정도를 측정하여 관성이 많은 상품들을 그룹화하는 클러스터링(clustering)의 일종

- 동시에 구매될 가능성이 큰 상품들을 찾아냄으로써 시장바구니분석(Market Basket Analysis)에서 다루는 문제들에 적용

(item set A -> item set B)
if A then B :만일 A가 일어나면 B도 일어난다

- 연관성측정에서의 연관규칙은 ꡒ상품 A가 구매되어진 경우는 상품 B도 구매된다.ꡓ 라고 해석된다.
- 연관 규칙기법을 이용할 수 있는 데이터는 판매시점에서 기록되어진 거래와 품목에 관한 정보를 담고 있어야 한다.
- 데이터의 형태는 결과변수(targets)를 갖지 않는Unsupervised data이며 특별히 각 고객들이 누구인지에 대한 구분이나 고객들에 관한 성별, 나이 등의 인구 통계학적인 자료를 비롯한 기타 정보들을 필요로 하지는 않는다.

측정의 기본은 얼마나 자주 구매되었는가 하는 빈도(Count)이다.
이 빈도를 기반으로 연관 정도를 정량화 하기 위해서 다음 세 가지 기준을 고려한다.
*원하는 자료를 검색 해 보세요.
  • [데이터마이닝][데이터마이닝 활용 사례][데이터마이닝 한계점]데이터마이닝의 처리과정, .. 13 페이지
    데이터마이닝은 크게 컴퓨터 과학의 관점, MIS 관점, 통계적 관점으로 나누어 정의할 수 있다. 컴퓨터 과학적인 관점에서는 패턴 인식 기술뿐만 아니라 통계적·수학적 분석 방법을 이용하여 저장된 거대한 자료로부터 우리에게 유익하..
  • 데이터마이닝을통한 서울시민의 만족도 분석 10 페이지
    서울시민의 행복도 분포 응답자의 대부분(45%)이상이 서울 생활에 대한 만족도를 높게 평가함 결측치는 0%에 가까움 매우 작은 값을 가짐 <중 략> 의사결정 나무분석결과 서울에 대한 만족도는 서울시정에 대한 신..
  • [정보공학] 데이타마이닝기법의 신경망기벚 9 페이지
    <데이터마이닝과 마이닝기법의 신경망기법> 1. Data Mining의 정의 데이터마이닝이란 대량의 데이터로 부터 쉽게 드러나지 않는 유용한 정보들을 추출하는 과정을 말한다. 여기서 정보는 묵시적이고 잘 알려져 있지..
  • 데이터웨어하우스와 데이터마이닝 10 페이지
    데이터가 아무리 잘 수집되고 조직돼 있다고 해도 단순히 데이터를 데이터웨어하우스에 저장하는 수준으론 아무 이익이 없다. 이 데이터웨어하우스에서 정보를 가져와 활용할 수 있는 수단을 제공해야만 다양한 이익원을 창출하는 완벽한 데..
  • 데이터마이닝(유사도계산) 7 페이지
    1.유사성이란? 여러 개의 분석대상 Data를 대상으로 다양한 분석(패턴분석, 군집분석, 음성인식 등)을 수행한다고 하자. 이를 위해서는 우리는 Data간 유사도를 정량적으로 계산하는 방법을 정의하고 계산식에 근거하여 Dat..
      최근 구매한 회원 학교정보 보기
      1. 최근 2주간 다운받은 회원수와 학교정보이며
         구매한 본인의 구매정보도 함께 표시됩니다.
      2. 매시 정각마다 업데이트 됩니다. (02:00 ~ 21:00)
      3. 구매자의 학교정보가 없는 경우 기타로 표시됩니다.
      최근 본 자료더보기
      추천도서