*정*
Bronze개인
팔로워0 팔로우
소개
등록된 소개글이 없습니다.
전문분야 등록된 전문분야가 없습니다.
판매자 정보
학교정보
입력된 정보가 없습니다.
직장정보
입력된 정보가 없습니다.
자격증
  • 입력된 정보가 없습니다.
판매지수
전체자료 1
검색어 입력폼
  • 판매자 표지 [데이타마이닝] 웹 로그 데이터의 효과적인 분석 및 eCrm의 적용
    [데이타마이닝] 웹 로그 데이터의 효과적인 분석 및 eCrm의 적용 평가A+최고예요
    웹 로그 데이터의 효과적인 분석 및 eCrm의 적용목 차1. 서 론2. 관련연구2.1 웹 로그 (Web Log)2.2 웹 마이닝 (Web Mining)2.3 경로 완성 (Path Completion)2.4 패턴 발견 (Pattern Discovery)2.4.1 연관성 규칙 (Association rules) / 순차적 패턴 (Sequential pattern)2.4.2 군집화 (Clustering)2.4.3분류(Classification)2.4.4 패턴 분석(Pattern Analysis)3. 웹로고 분석을 통한 eCrm 적용4. 결론1. 서 론인터넷의 발달로 인해 인터넷의 사용률도 급속도로 증가하고 있으며, 컨텐츠의 다양화로 단순히 정보검색의 수단으로 사용되는 것이 아니라 비즈니스를 위한 매개체로 이용되며 삶의 일부분으로 정착되어 가고있다. 따라서 인터넷을 서비스 해주는 기업들은 웹을 통하여 고객의 정보를 습득하고 분석하여 고객에게 최적의 개인화된 상품 및 서비스를 제공하여 고객의 충성도를 확보하려고 하고 있으며 사용자는 보다 개인화된 정보를 원하고 있다. 이와같은 목적으로 데이터마이닝을 적용시킬수 있겠으며 그중에 웹 로그 파일에 대한 분석을 통하여 좀더 구체적인 정보를 얻을수 있을 것이다.웹 로그 화일은 사용자가 웹 문서를 액세스할 때 웹 서버에 의해 기록되는 정보로 WWW이 보편화됨에 따라 점차 그 활용 가치가 높아지고 있다. Web 데이터 활용 문제에서 중요한 비중을 차지하고 있는 Log 데이터의 효과적 활용 방안을 모색해보고자 한다. Web Log 데이터는 Web 서버에 대한 모든 방문객의 접근및 조회 내역 등에 대한 정보를 기록하고 있는 데이터이며, Web 사용자들의 행동 패턴, 트래픽(traffic) 분석 등을 위하여 이용된다. Web Log 데이터를 취급하고자 하는 이유는 그 데이터가 가지고 있는 특징 때문이다.2. 관련연구2.1 웹 로그 (Web Log)웹상에서 사용자들의 활동에 관한 기초적인 정보는 웹 서버에 의해 자동적으로 수집되어 웹로그라 사용자들의 웹 페이지 방문은 시간에 따라 순차적으로 이루어지며, 로그 데이터는 주로 사용자들의 웹 페이지 방문 패턴을 발견하기 위한 목적으로 이용된다. 따라서 웹 페이지 방문 순서와 방문 시간은 로그 데이터의 분석을 위한 중요한 요소이다. 웹 페이지 방문 순서 정보를 이용하는 대표적인 분석은 순차 패턴 발견과 연관 규칙 탐색 등을 들 수 있으며, 아래와 같은 경로완성, 패턴발견, 패턴분석의 절차를 통하여 웹 마이닝을 수행 할 수 있으며 여러 분석 방법을 이용할수있다.2.2 웹 마이닝 (Web Mining)웹 서버는 로그파일이라는 대용량의 데이터를 수록하고 있다. 이러한 정보를 분석함으로써 전자상거래에 유용한 정보를 도출해 낼 수 있다. 웹 사이트로부터 로그파일과 같은 데이터를 분석하고 전략을 수립하는 일을 웹 마이닝 (web mining)이라고 한다. 웹 마이닝은 웹 트래픽 분석에 사용되는 로그 파일에 다른 데이터를 추가시켜 분석하는 것을 의미하며, 다른 데이터로는 고객 데이터, 회계 데이터, 전자상거래 자료 등이 포함된다. 웹 마이닝을 통해 얻을 수 있는 정보는 다음과 같다어떤 사람들이 우리의 사이트를 방문하는가?어떤 사이트를 거쳐서 사람들이 우리의 사이트를 방문하는가?방문자의 인구통계학적 생활양식 분류 정보와 사이트 방문행태와는 어떤 관련이 있는가?사이트에서 얻어지는 수익은 무엇이며 얼마나 되는가?어떤 광고 배너가 가치 있는 고객들을 우리 사이트로 오게 만드는가?어떤 페이지가 실제로 구매를 하는 사람 수를 증가시키는 데 기여하는가? 웹 마이닝을 통해 얻을 수 있는 정보2.3 경로 완성 (Path Completion)웹마이닝을 수행하기 위해 꼭 거쳐야 되는 절차 중의 하나가 바로 경로 완성 단계이다. 경로 완성은 웹 서버 로그 파일에 저장되지 않은 중요한 요청 페이지들을 찾아내어 사용자 행동이력에 포함시키는 과정 이다. 이 과정이 필요한 이유는 브라우저 캐시(cache)에 그 원인이 있다. 대부분의 브라우저는 PC의 파일 시스템에 있는 로컬 객체 캐시에 최우 웹 서버 로그에는 이 사건에 대한 아무런 기록도 저장되지 않는다. 경로 완성은 이와 같이 브라우저 케시에 의해 기록되지 않은 요청 페이지들을 찾는 과정이라 하겠다.2.4 패턴 발견 (Pattern Discovery)패턴 발견은 웹마이닝의 가장 중요한 단계이다. 이것은 패턴 발견의 여러 기법을 이용하여 사용자들의 패턴을 찾아내는 과정으로 여기서 찾아낸 패턴을 이용하여 고객의 성향을 파악하고 행동을 예측하는 등의 고객 응대 전략을 세우게 된다. 패턴 발견 과정에서는 연관성 규칙(Association rule), 순차적 패턴(Sequential pattern), 군집화(Clustering), 분류(Classification) 등의 기법을 사용한다.2.4.1 연관성 규칙 (Association rules) / 순차적 패턴 (Sequential pattern)웹마이닝에서의 연관성 규칙은 함께 접속하게 되는 페이지를 뜻한다. 예를 들어 AB와 같은 연관성 규칙은 페이지 A를 보는 고객은 페이지 B도 본다는 의미이다. 연관성 규칙을 평가하는 기준으로는 지지도(support), 신뢰도(confidence), 향상도(lift or improvement)가 있다. 연관성 규칙 AB의 지지도는 전체 사용자 중에서 페이지 A와 페이지 B를 모두 접속한 사용자의 비율로 표현된다. 즉, 두 페이지를 모두 볼 확률 P(AB)를 의미한다. 신뢰도는 페이지 A를 본 사용자 중에서 페이지 B도 본 사용자의 비율을 나타낸다. 즉, 조건부 확률 P(B|A)로 표현할 수 있다. 향상도는 전체 사용자 중에 페이지 B를 본 사용자의 비율, P(B)와 페이지 A를 본 사용자 중에서 페이지 B를 본 사용자의 비, 즉, 신뢰도 AB의 비율로 나타낸다. 즉, P(B|A)/ P(B)가 된다. 이는 페이지 A를 본다는 것이 페이지 B도 역시 방문하도록 만드는가를 재는 값으로 1보다 크면 페이지 A가 페이지 B의 방문비율을 높게 하는 것이고 1보다 작으면 연관성이 낮다는 것을 의미한다. 그러므로 의미있는 연관 된 방문(혹은 구매)의 집합에서'어느 한 페이지의 접속이 다른 페이지의 접속 이후에 나타난다'와 같은 방문(혹은 구매)간의 패턴을 찾는다. 순차적 패턴 발견을 통해 웹 사이트 운영자는 앞으로의 사용자 접속 패턴을 예측할 수 있다.2.4.2 군집화 (Clustering)웹마이닝에서의 군집은 유사한 행동 패턴을 보이는 사용자의 그룹을 가리킨다. 이 그룹을 통해 사용자의 인구 통계학적 변수를 추정해서 시장을 세분화하고 사용자에게 개인화된 웹 컨텐츠를 좀더 쉽게 제공할 수 있다. 사용자의 군집은 먼저 사용자 세션 간의 유사성(similarity), 혹은 비유사성(dissimilarity) 을 측정하고, 이를 이용해 계보적(hierarchical) 군집 분석 방법을 통해 얻을 수 있다. 사용자 간의 유사성을 측정하는 대표적인 방법은 사용자의 웹 사이트 방문 벡터가 이루는 각도(angle)의 코사인 패턴 발견은 여러 기법을 이용하여 사용자들의 소비유형을 찾아내는 과정으로 여기서 찾아낸 패턴을 이용하여 고객의 성향을 파악하고 행동을 예측하는 등의 고객응대전략을 세우게 된다. 패턴 발견 과정에서는 연관성 규칙(Association rule), 순차적 패턴(Sequential pattern), 군집화(Clustering), 분류(Classification) 등의 기법을 사용한다. (cosine) 값을 이용하는 것이다(Joshi and Krishinapuram, 2000)1). 사용자간 유사성에 근거한 계보적 군집 방법은 가까운 사용자를 묶어감으로써 군집을 만들어가는 병합적인 방법과 먼 사용자들을 나누어 가는 분할적 방법으로 나눌 수 있다. 통상적으로는 병합적 방법을 사용하는데 이는 분할적 방법의 경우 군집을 구성하는 가지수가 사용자의 증가에 따라 급격히 증가하여 실제 적용에 어려움이 따르기 때문이다. 자세한 군집 방법은 Gordon(1981)2)을 참조하길 바란다.2.4.3분류(Classification)분류는 각 사용자들을 미리 정해진 몇 개의 그룹 중 하나에 할당하는 것정 제품을 구매하는 사용자들은 누구이며 어떤 특성을 갖는지 등의 내용을 알고 싶어한다. 이런 경우 사용할 수 있는 웹마이닝 기법이 분류이며 의사결정나무(decision tree), Naive Bayesian 분류, 신경망분석 등의 알고리즘을 이용하여 분석을 수행할 수 있다.2.4.4 패턴 분석(Pattern Analysis)패턴 분석 과정은 웹마이닝의 마지막 단계로, 패턴 발견 과정에서 찾아낸 규칙이나 패턴 중에서 유용하지 않거나 의미 없는 규칙과 패턴을 걸러 내는 단계라고 할 수 있다. 또한 유용하고 의미 있는 규칙과 패턴을 찾아냈다면 그것을 이해하고, 해석하는 단계이기도 하다. 발견된 패턴을 분석하는 기법으로는 시각화(visualization)와 OLAP(On-Line Analytical Processing)이 있다. 시각화 기법에서는 패턴을 그래프로 표현하고 이를 다른 색깔들로 구분함으로써 전반적인 패턴이나 성향을 강조한다. OLAP은 다차원 데이터 베이스(multidimensional database) 안에 저장되어 있는 데이터를 선택적으로 추출해 내고, 여러 관점으로 데이터를 볼 수 있도록 해준다.3. 웹로고 분석을 통한 eCrm 적용고객관계를 개선하기 위한 CRM 분석이 단지 고객 DB 나 웹로그에 대한 분석이 아니기 때문에 웹로그를 통한 고객 파악에는 어느 정도 한계를 갖게 된다. 로그분석을 통하여 효율적으로 고객 대응을 할 수 있는 방법을 얻고자 하지만 로그분석 데이터의 결과를 보면 이러한 데이터를 어떻게 활용해야 하는지 난감해 하는 경우가 있다. 로그분석데이터는 서버에 기록된 사이트 방문자 데이터를 로그분석 툴을 활용하여 각 조건(월별/일별/시간별/등)에 의하여 정리한 것으로 고객 개개인에 관한 정확한 데이터가 아닌 단순한 방문자의 방문기록 정보이기 때문에 사이트현황에 관한 기본적인 분석만 할 수 있다. 따라서 분석툴이 갖는 한계도 있고 담당자의 분석능력에 대한 한계, 쿠키용량 및 쿠키 제한등에 따른 쿠키의 한계, 로그분석의 방문데이터 또한 다다.
    공학/기술| 2003.06.22| 6페이지| 1,000원| 조회(766)
    미리보기
전체보기
받은후기 1
1개 리뷰 평점
  • A+최고예요
    1
  • A좋아요
    0
  • B괜찮아요
    0
  • C아쉬워요
    0
  • D별로예요
    0
전체보기
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2026년 05월 23일 토요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
12:40 오전
문서 초안을 생성해주는 EasyAI
안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감