경영데이터마이닝 데이터 기초분석 발표자료
본 내용은
"
경영데이터마이닝 데이터 기초분석 발표자료
"
의 원문 자료에서 일부 인용된 것입니다.
2023.07.18
문서 내 토픽
  • 1. 직원 퇴사율 증가 문제
    A 회사의 인사과 담당자는 A 회사 직원들의 퇴사율이 증가하고 있음을 발견했습니다. 신규 직원 채용 비용을 절감하고, 우수 인재 유지를 위해서 인사관리 정책을 새롭게 바꾸고자 합니다. 과거 데이터를 분석하여 직원들의 니즈를 반영한 맞춤형 인사관리를 하려고 합니다.
  • 2. 데이터 마이닝 문제
    회사를 그만두는 사람과 그렇지 않은 사람은 어떤 기준으로 분류될까? 회사를 그만두는 주된 이유는 무엇일까? 현재 회사를 다니고 있지만 곧 떠날 것이라고 추정되는 사람들은?
  • 3. 데이터 소개
    인구통계학적 정보와 회사생활에 관한 정보를 포함한 직원 1470명의 데이터가 제공되었습니다. 목표변수는 직원의 퇴사(Attrition) 여부(YES/NO)입니다.
  • 4. 데이터 기초분석
    데이터에는 26개의 연속형 입력변수와 8개의 범주형 입력변수가 포함되어 있습니다.
  • 5. 활용 예정 기법
    의사결정나무, 인공신경망, 로지스틱 회귀분석 기법을 활용할 예정입니다.
  • 6. 의사결정나무 결과
    C5.0 모델의 정확도는 94.7%, 민감도는 98.7%입니다. CART 모델의 정확도는 76.7%, 민감도는 74.8%입니다. CHAID 모델의 정확도는 80.1%, 민감도는 75.7%입니다.
  • 7. 인공신경망 결과
    인공신경망 모델의 정확도는 82.0%, 민감도는 80.1%입니다.
  • 8. 로지스틱 회귀분석 결과
    로지스틱 회귀분석 모델의 정확도는 78.3%, 민감도는 79.4%입니다. 근무 기간이 한 단위 증가할수록 퇴직률에 대한 오즈비가 0.95배로 감소하고, 훈련 기간이 한 단위 증가할수록 퇴직률에 대한 오즈비가 0.85배로 감소합니다. 또한 건강관리 판매원, 매니저, 제조업 감독, 연구원이 'Sales Representative'에 비해 상대적으로 퇴직 가능성이 낮습니다.
  • 9. 문제 해결 및 시사점
    회사를 그만두는 주된 이유는 Over Time, Job Level ≤ 1, Job Involvement ≤ 3, Monthly Income ≤ $3751.1, Year since Last Promotion = 0, Total Working Years, Training Times Distance from Home ≤ 15 (약 24km)인 것으로 나타났습니다. A 회사가 우수 인재 유지를 위해 새롭게 시행할 회사 정책의 방향은 10시 이후 야근 금지, 자율 퇴근제 도입, 장거리 출퇴근자 교통비 지원, 직원 교육 프로그램 강화, 성과 가시화 승진 예고제 등입니다.
Easy AI와 토픽 톺아보기
  • 1. 직원 퇴사율 증가 문제
    직원 퇴사율 증가는 기업에 많은 부담을 줄 수 있습니다. 이는 인력 수급 문제, 생산성 저하, 고객 서비스 질 하락 등 다양한 문제를 야기할 수 있습니다. 따라서 기업은 직원들의 이직 원인을 면밀히 분석하고, 이를 해결하기 위한 다각도의 노력이 필요합니다. 예를 들어 보상 체계 개선, 복지 혜택 확대, 업무 환경 개선, 교육 및 경력 개발 기회 제공 등의 방안을 고려해볼 수 있습니다. 또한 조직 문화 개선을 통해 직원들의 소속감과 만족도를 높이는 것도 중요할 것 같습니다. 이러한 노력을 통해 기업은 우수한 인재를 유치하고 유지할 수 있을 것입니다.
  • 2. 데이터 마이닝 문제
    데이터 마이닝은 방대한 데이터 속에서 유의미한 정보와 패턴을 발견하는 중요한 기술입니다. 그러나 데이터 마이닝을 수행할 때에는 몇 가지 주의해야 할 점이 있습니다. 첫째, 데이터의 품질과 신뢰성을 확보해야 합니다. 부정확하거나 편향된 데이터를 사용하면 잘못된 결과를 도출할 수 있습니다. 둘째, 분석 목적과 방법론을 명확히 설정해야 합니다. 분석 목적에 맞지 않는 기법을 사용하면 의미 있는 결과를 얻기 어려울 수 있습니다. 셋째, 분석 결과에 대한 해석과 활용에 주의를 기울여야 합니다. 데이터 마이닝 결과를 실제 의사결정에 활용할 때는 상황 맥락을 고려하여 신중하게 판단해야 합니다. 이러한 점들을 고려하여 데이터 마이닝을 수행한다면 기업은 보다 효과적인 의사결정을 내릴 수 있을 것입니다.
  • 3. 데이터 소개
    데이터 소개 부분에서는 분석 대상이 되는 데이터의 특성과 구조, 출처 등을 명확히 설명하는 것이 중요합니다. 데이터의 범위, 형태(정형/비정형), 수집 방법, 시간적 범위 등을 상세히 기술하여 데이터에 대한 이해도를 높여야 합니다. 또한 데이터의 한계점이나 결측치, 이상치 등 데이터 품질과 관련된 사항도 함께 언급해야 합니다. 이를 통해 분석 결과의 신뢰성을 확보할 수 있습니다. 데이터 소개 부분은 전체 분석 과정의 기반이 되므로, 데이터에 대한 충분한 이해와 설명이 선행되어야 할 것입니다.
  • 4. 데이터 기초분석
    데이터 기초분석은 데이터의 특성을 이해하고 탐색하는 중요한 단계입니다. 이 단계에서는 데이터의 기본적인 통계량(평균, 중앙값, 표준편차 등)을 확인하고, 변수 간 상관관계를 분석하며, 이상치나 결측치를 식별하는 등의 작업이 이루어집니다. 이를 통해 데이터의 품질과 특성을 파악할 수 있으며, 향후 분석 모델 선정 및 변수 선택 등에 활용할 수 있습니다. 또한 데이터 시각화를 통해 데이터의 패턴과 특징을 직관적으로 파악할 수 있습니다. 데이터 기초분석은 분석의 기반을 마련하는 필수적인 단계이므로, 충분한 시간과 노력을 투자하여 데이터에 대한 깊이 있는 이해를 얻는 것이 중요합니다.
  • 5. 활용 예정 기법
    데이터 분석에 활용할 기법을 선정할 때는 분석 목적, 데이터 특성, 모델의 해석 가능성 등을 종합적으로 고려해야 합니다. 예를 들어 의사결정나무는 모델의 해석이 용이하고 변수 중요도를 파악할 수 있어 분류 문제에 적합합니다. 반면 인공신경망은 복잡한 비선형 관계를 모델링할 수 있지만 모델의 해석이 어려운 편입니다. 로지스틱 회귀분석은 변수 간 관계를 파악하기 쉽고 결과 해석이 용이합니다. 이처럼 각 기법의 장단점을 이해하고 분석 목적에 부합하는 기법을 선택하는 것이 중요합니다. 또한 단일 기법보다는 여러 기법을 병행하여 분석하는 것이 보다 신뢰할 수 있는 결과를 얻을 수 있습니다.
  • 6. 의사결정나무 결과
    의사결정나무 분석 결과를 살펴보면, 직원 퇴사에 가장 큰 영향을 미치는 요인은 연봉 수준인 것으로 나타났습니다. 연봉이 낮은 직원들의 퇴사율이 상대적으로 높게 나타났습니다. 또한 직급, 근속 연수, 교육 수준 등의 요인도 퇴사 여부에 유의미한 영향을 미치는 것으로 확인되었습니다. 이러한 결과를 바탕으로 기업은 직원 보상 체계 개선, 경력 개발 기회 제공, 교육 투자 확대 등의 방안을 고려해볼 수 있습니다. 또한 특정 직군이나 연령대의 퇴사율이 높은 경우 이에 대한 원인 분석과 대응 방안 마련이 필요할 것으로 보입니다.
  • 7. 인공신경망 결과
    인공신경망 모델 분석 결과, 직원 퇴사 예측에 가장 큰 영향을 미치는 요인은 직원의 연봉, 직급, 근속 연수, 교육 수준 등인 것으로 나타났습니다. 특히 연봉이 낮고 직급이 낮은 직원, 그리고 근속 연수가 짧은 직원일수록 퇴사 가능성이 높은 것으로 분석되었습니다. 이러한 결과는 앞서 살펴본 의사결정나무 분석 결과와 유사한 양상을 보입니다. 다만 인공신경망 모델은 복잡한 비선형 관계를 모델링할 수 있어, 변수 간 상호작용 효과를 보다 정교하게 파악할 수 있다는 장점이 있습니다. 따라서 기업은 이러한 분석 결과를 토대로 직원 보상 및 경력 개발 정책을 수립하고, 특히 저연봉 직원과 신입 직원에 대한 관리에 주력할 필요가 있습니다.
  • 8. 로지스틱 회귀분석 결과
    로지스틱 회귀분석 결과, 직원 퇴사에 가장 큰 영향을 미치는 요인은 연봉, 직급, 근속 연수, 교육 수준 등인 것으로 나타났습니다. 구체적으로 연봉이 낮을수록, 직급이 낮을수록, 근속 연수가 짧을수록, 교육 수준이 낮을수록 퇴사 가능성이 높아지는 것으로 분석되었습니다. 이러한 결과는 앞서 살펴본 의사결정나무와 인공신경망 분석 결과와 유사한 양상을 보입니다. 로지스틱 회귀분석은 변수 간 관계를 파악하기 쉽고 결과 해석이 용이하다는 장점이 있어, 기업은 이를 토대로 직원 보상 및 경력 개발 정책을 수립할 수 있습니다. 특히 저연봉 직원과 신입 직원에 대한 관리에 주력하여 퇴사율 감소를 도모해야 할 것입니다.
  • 9. 문제 해결 및 시사점
    이상의 분석 결과를 종합해볼 때, 직원 퇴사율 증가 문제를 해결하기 위해서는 다음과 같은 방안을 고려해볼 수 있습니다. 첫째, 직원 보상 체계 개선이 필요합니다. 분석 결과 연봉 수준이 퇴사율에 가장 큰 영향을 미치는 것으로 나타났으므로, 적정 수준의 연봉 인상과 성과 보상 강화 등을 통해 직원들의 처우 개선이 요구됩니다. 둘째, 직원 경력 개발 기회를 확대해야 합니다. 직급과 근속 연수가 퇴사율에 유의미한 영향을 미치는 것으로 분석되었으므로, 교육 훈련 제공, 승진 기회 확대, 직무 순환 등 다양한 경력 개발 프로그램을 운영할 필요가 있습니다. 셋째, 조직 문화 개선이 필요합니다. 직원들의 소속감과 만족도를 높이기 위해 수평적이고 유연한 조직 문화를 조성하고, 리더십 역량 강화 등의 노력이 요구됩니다. 이러한 다각도의 노력을 통해 기업은 우수한 인재를 유치하고 유지할 수 있을 것이며, 나아가 조직의 생산성과 경쟁력 향상에도 기여할 수 있을 것입니다.
주제 연관 리포트도 확인해 보세요!