• AI글쓰기 2.1 업데이트
  • AI글쓰기 2.1 업데이트
  • AI글쓰기 2.1 업데이트
  • AI글쓰기 2.1 업데이트
PARTNER
검증된 파트너 제휴사 자료

대규모 오픈 데이터 레이크 구축을 위한플랫폼 독립적 자동화 프레임워크 (A Platform-independent Framework for Automatic Constructing Large-scale Open Data Lakes)

13 페이지
기타파일
최초등록일 2025.07.18 최종저작일 2022.12
13P 미리보기
대규모 오픈 데이터 레이크 구축을 위한플랫폼 독립적 자동화 프레임워크
  • 미리보기

    서지정보

    · 발행기관 : 한국정보과학회
    · 수록지 정보 : 데이타베이스연구 / 38권 / 3호 / 83 ~ 95페이지
    · 저자명 : 김다솔, 문양세

    초록

    최근 각국 정부와 기관의 데이터 공개가 활발해지면서, 머신 러닝, 데이터 분석 등 다양한 분야에서 오픈 데이터 활용 연구가 크게 증가하고 있다. 오픈 데이터는 주로 정부에서 공개하는 공공 데이터로, 이를 관리하는 저장소를 오픈 데이터 레이크라 한다. 본 논문에서는 오픈 데이터의 활용도를 높이기 위해, 여러 포탈에 분산된 데이터를 연계하여 특정 도메인에 대한 오픈 데이터 레이크 구축 지원 프레임워크를 제안한다. 이를 위해, 기존 오픈 데이터 포탈의 데이터 관리 방식을 분석하고 활용도를 저하시키는 전처리 복잡성, 플랫폼 종속성, 스케일 제한의 세 가지 문제점을 도출한다. 전처리 복잡성과 스케일 제한 문제를 해결하기 위해 자동화 확장 기능을 적용한 세 단계의 자동화 처리 로직을 구현하고, 플랫폼 종속성 문제 해결을 위해 플랫폼에 따른 세부 처리 로직을 구현한다. 또한, 오픈 데이터 레이크를 위한 메타데이터 관리 기능을 설계 및 구현한다. 실제 데이터 포탈을 대상으로 한 실험을 통해, 제안하는 프레임워크가 앞서 도출한 문제를 모두 해결하고, 데이터 레이크 구축뿐 아니라 효율적인 관리를 지원하는 통합 프레임워크임을 확인한다. 본 논문의 결과물은 오픈 데이터의 활용도를 높이고, 연구 데이터 부족 문제를 해결하는 실질적인 해결책을 제시한 최초의 통합 프레임워크라 할 수 있다.

    영어초록

    With the recent increase in data disclosure, research using open data in various fields, such as machine learning and data analysis, is also rapidly increasing. Open data is public data that is released by the government, and the repository that manages it is called an open data lake. In this paper, we propose a new framework for constructing an open data lake for a specific domain by federating the data distributed across multiple portals to increase open data utilization. We analyze data management methods of the existing data portals and derive three problems: pre-processing complexity, platform dependency, and scale limitation that reduce usability. To solve the pre-processing complexity and scale limitation problems, we present the three-step automatic processing logic to which we applied the automation expansion. We also propose a detailed processing logic according to the platform to solve the platform dependency problem. We then design and implement metadata management functions for an open data lake. Through experiments, we confirmed that the proposed framework is an integrated solution that solves all problems previously derived and supports efficient management and construction of a data lake. We present the first integrated framework that supports the construction and management of open data lakes.

    참고자료

    · 없음
  • 자주묻는질문의 답변을 확인해 주세요

    해피캠퍼스 FAQ 더보기

    꼭 알아주세요

    • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
      자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
      저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
    • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
      파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
      파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

“데이타베이스연구”의 다른 논문도 확인해 보세요!

문서 초안을 생성해주는 EasyAI
안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
- 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감
  • EasyAI 무료체험
해캠 AI 챗봇과 대화하기
챗봇으로 간편하게 상담해보세요.
2025년 10월 09일 목요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
2:32 오전