• 전문가 요청 쿠폰 이벤트
PARTNER
검증된 파트너 제휴사 자료

클러스터링 모델 기반의 체육 분야 공공 데이터 분석 및 고찰 (Analysis and Discussion of Public Sports Data based on Clustering Model)

10 페이지
기타파일
최초등록일 2025.04.26 최종저작일 2024.02
10P 미리보기
클러스터링 모델 기반의 체육 분야 공공 데이터 분석 및 고찰
  • 미리보기

    서지정보

    · 발행기관 : 사단법인 한국융합기술연구학회
    · 수록지 정보 : 아시아태평양융합연구교류논문지 / 10권 / 2호 / 25 ~ 34페이지
    · 저자명 : 홍서빈, 김봉현

    초록

    본 논문은 현대 사회에서 빠르게 증가하는 데이터의 양과 다양성으로 인해 효과적인 분석과 이해가 중요한 과제로 부각되고 있는 상황에서, 공공데이터의 클러스터링을 통해 데이터 품질과 일관성에 대한 문제점을 도출하고 개선 방안을 모색하는 것을 목표로 하였다. 데이터는 data.go.kr에서 제공되는 체육 분야의 공공데이터를 사용하며 텍스트 데이터에서 명사를 추출하고 TF-IDF 벡터화를 사용하여 클러스터링을 수행하였다. K-means, DBSCAN, GMM 알고리즘과 키워드 추출 방법을 비교하여 성능을 평가하고, 데이터의 일관성과 품질에 대한 문제점을 분석하였다. 연구 결과, 불용어 처리와 키워드 추출 방법의 선택이 클러스터링 결과에 큰 영향을 미침을 확인하였다. 또한 데이터의 길이, 형식, 키워드 품질 등이 클러스터링의 성능에 영향을 미치는 것으로 나타났다. 데이터의 불균형과 일관성 부재, 표준 부재 등이 클러스터링 결과에 영향을 미칠 수 있으며, 향후에는 이러한 문제를 해결하기 위한 표준화된 가이드라인과 연구가 필요하다는 결론을 도출하였다. 클러스터링을 통해 데이터의 다양성을 파악하고, 이를 통해 데이터 수집과 분석 전략을 개선하는 방안을 제시하며, 공공데이터의 효과적인 활용을 위해 데이터의 품질 향상과 클러스터링 기법의 적극적 활용이 중요하다는 점을 강조한다.

    영어초록

    In a situation where effective analysis and understanding are emerging as important tasks due to the rapidly increasing amount and diversity of data in modern society, this paper identifies problems with data quality and consistency through clustering public data and seeks ways to improve them. The data used was general in physical education provided by data.go.kr. Nouns were extracted from text data and clustering was performed using TF-IDF vectorization. Performance was evaluated by comparing K-means, DBSCAN, and GMM algorithms and keyword extraction methods, and problems with data consistency and quality were analyzed. As a result of the study, it was confirmed that stopword processing and choice of keyword extraction method had a significant impact on clustering results. Additionally, data length, format, and keyword quality affect clustering performance. It was concluded that data imbalance, lack of consistency, and lack of standards can affect clustering results and that standardized guidelines and research are needed to solve these problems. We identify the diversity of data through clustering, suggest ways to improve data collection and analysis strategies through this, and emphasize the importance of improving data quality and active use of clustering techniques for the effective use of public data.

    참고자료

    · 없음
  • 자주묻는질문의 답변을 확인해 주세요

    해피캠퍼스 FAQ 더보기

    꼭 알아주세요

    • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
      자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
      저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
    • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
      파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
      파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

“아시아태평양융합연구교류논문지”의 다른 논문도 확인해 보세요!

문서 초안을 생성해주는 EasyAI
안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2026년 04월 04일 토요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
1:42 오전