• AI글쓰기 2.1 업데이트
NEW
업로드 2주 이내인 자료
PLATINUM
PLATINUM 등급의 판매자 자료
non-ai
판매자가 AI를 사용하지 않은 독창적인 자료

파이썬데이터처리 2026년 1학기 방송통신대 중간과제물)뉴스 데이터 수집 및 전처리 공공 API를 활용한 데이터 수집 및 분석 등

12 페이지
압축파일
최초등록일 2026.03.02 최종저작일 2026.03
12P 미리보기
파이썬데이터처리 2026년 1학기 방송통신대 중간과제물)뉴스 데이터 수집 및 전처리 공공 API를 활용한 데이터 수집 및 분석 등
  • 미리보기

    소개

    - 교재를 중심으로 쉽게 따라할 수 있도록 자세한 설명을 담아 정성을 다해 명확하게 작성하였습니다.
    - 파이썬 파일(py), 주피터노트북 파일(ipynb), csv 파일을 첨부하였습니다.
    - 과제물 지시사항에 따른 형식과 내용으로 완벽하게 작성하였습니다.
    - 한눈에 내용이 들어올 수 있게 가독성을 고려하여 일목요연하게 작성하였습니다.
    - 한글맞춤법을 정확하게 준수하였습니다.

    바쁜 일상 속에서 양질의 리포트를 작성하시는 데, 시간과 노력을 최소화할 수 있는 과제물로 리포트 작성에 참고하시어 좋은 성적 받으세요.^^

    글자 모양(맑은고딕, 장평 100%, 크기 11 pt, 자간 0%)

    과제 스트레스 싹~ 학점 쑥!

    목차

    문제 1. 뉴스 데이터 수집 및 전처리 (15점)

    1. 개요
    2. 데이터 수집
    3. 결측치 및 데이터 정제
    4. 비교분석

    문제 2. 공공 API를 활용한 데이터 수집 및 분석 (15점)

    1. Extract
    2. Transform
    3. Load & Insight

    * 참고문헌

    본문내용

    문제 1. 뉴스 데이터 수집 및 전처리 (15점)

    1. 개요

    requests와 BeautifulSoup는 파이썬에서 웹 데이터를 수집할 때 가장 널리 사용되는 라이브러리다. 두 모듈을 함께 사용하면 웹 페이지를 가져오고 그 안의 정보를 구조적으로 추출할 수 있다.

    먼저 requests는 웹 서버에 HTTP 요청을 보내는 라이브러리다. 쉽게 말해 브라우저 대신 파이썬 코드로 웹 페이지를 불러오는 역할을 한다. 특정 URL에 접속해 HTML 문서를 받아오거나, POST 방식으로 데이터를 전송하는 작업을 수행한다. 사용 방법은 매우 직관적이며, requests.get(URL) 형태로 요청을 보내고, response.text로 HTML 소스를 얻는다. 상태 코드(response.status_code)를 통해 요청 성공 여부도 확인할 수 있다.

    BeautifulSoup는 가져온 HTML 문서를 분석하고 원하는 정보를 추출하는 파서(parser)다. HTML은 태그 구조로 이루어져 있기 때문에 단순 문자열 처리로는 원하는 데이터를 찾기 어렵다. BeautifulSoup는 HTML을 트리 구조로 변환해 주며, 태그 이름, 클래스, id 등을 기준으로 요소를 쉽게 선택할 수 있게 한다. BeautifulSoup은 문서를 트리 구조로 변환하여 특정 태그, 속성, 텍스트를 직관적으로 검색하거나 수정할 수 있게 하며, CSS 선택자나 태그 이름, 클래스 이름 등을 이용해 원하는 요소를 빠르게 찾아낼 수 있다. 예를 들어 soup.select("div.title")처럼 CSS 선택자를 이용해 특정 요소를 찾을 수 있다. 따라서 BeautifulSoup는 “가져온 웹 페이지를 해석하고 필요한 부분만 골라내는 도구”라고 이해하면 된다. 다만, 로그인이 필요하거나 동적 페이지 등의 경우에는 BeautifulSoup 대신 Selenium 모듈을 사용하는 것이 적합하다.

    이상의 내용을 바탕으로 requests, BeautifulSoup 모듈을 사용하여 ‘부동산’과 ‘주식’이라는 키워드를 사용하여 관련 기사 100건을 수집하고 이 데이터를 문제의 지시사항에 따라 분석하였다.

    참고자료

    · 한종대, 민경하(2025). 파이썬데이터처리. KNOU PRESS.
  • 압축파일 내 파일목록

    · 파이썬데이터처리.py
    · AirPollutionData.csv
    · 파이썬데이터처리.hwp
    · 파이썬데이터처리.ipynb
  • 자료후기

      Ai 리뷰
      판매자가 등록한 자료를 통해 새로운 인사이트를 얻고, 과제의 내용을 보강하는 데 큰 도움이 되었습니다. 정말 추천할 만한 자료입니다! 감사드립니다.
    • 자주묻는질문의 답변을 확인해 주세요

      해피캠퍼스 FAQ 더보기

      꼭 알아주세요

      • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
        자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
        저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
      • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
        파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
        파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

    “통계·데이터과학과” 연관 자료 입니다

    문서 초안을 생성해주는 EasyAI
    안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
    저는 아래와 같이 작업을 도와드립니다.
    - 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
    - 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
    - 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
    이런 주제들을 입력해 보세요.
    - 유아에게 적합한 문학작품의 기준과 특성
    - 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
    - 작별인사 독후감
    해캠 AI 챗봇과 대화하기
    챗봇으로 간편하게 상담해보세요.
    2026년 03월 03일 화요일
    AI 챗봇
    안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
    6:40 오전