• AI글쓰기 2.1 업데이트
PLATINUM
PLATINUM 등급의 판매자 자료

파이썬데이터처리 2025년 2학기 방송통신대 중간과제물)문제 1. 웹 스크래핑을 통한 데이터 수집 문제 2. 공공 API를 활용한 데이터 수집 및 분석 등

15 페이지
압축파일
최초등록일 2025.09.09 최종저작일 2025.09
15P 미리보기
파이썬데이터처리 2025년 2학기 방송통신대 중간과제물)문제 1. 웹 스크래핑을 통한 데이터 수집 문제 2. 공공 API를 활용한 데이터 수집 및 분석 등
  • 이 자료를 선택해야 하는 이유
    이 내용은 AI를 통해 자동 생성된 정보로, 참고용으로만 활용해 주세요.
    • 전문성
    • 실용성
    • 명확성
    • 유사도 지수
      직접 인용 주의
    • 🔍 웹 스크래핑과 API 데이터 수집의 실무적 가이드 제공
    • 💻 파이썬 데이터 처리의 실전 예제와 코드 상세 설명
    • 📊 데이터 분석 및 시각화의 체계적인 접근 방법 제시

    미리보기

    과제정보

    학과 통계·데이터과학과 학년 3학년
    과목명 파이썬데이터처리 자료 1건
    공통 문제 1. 웹 스크래핑을 통한 데이터 수집 (15점)
    문제 2. 공공 API를 활용한 데이터 수집 및 분석 (15점)

    소개

    - 쉽게 따라할 수 있도록 API 인증키 발급 과정과 파이썬 코드에 대한 상세한 설명을 포함하여 정성을 다해 명확하게 작성하였습니다.
    - 파이썬 파일(py)와 주피터노트북 파일(ipynb)을 첨부하였습니다.
    - 과제물 지시사항에 따른 형식과 내용으로 완벽하게 작성하였습니다.
    - 한눈에 내용이 들어올 수 있게 가독성을 고려하여 일목요연하게 작성하였습니다.

    바쁜 일상 속에서 양질의 리포트를 작성하시는 데, 시간과 노력을 최소화할 수 있는 과제물로 리포트 작성에 참고하시어 좋은 성적 받으세요.^^

    글자 모양(맑은고딕, 장평 100%, 크기 11 pt, 자간 0%)

    과제 스트레스 싹~ 학점 쑥!

    목차

    문제 1. 웹 스크래핑을 통한 데이터 수집 (15점)

    1. 데이터 수집(기사 제목, 날짜, 언론사, 요약문)
    2. 데이터 처리 및 저장
    3. 간단한 분석
    ①일자별 기사 수 집계
    ② 언론사별 기사 수 TOP 10
    ③ 제목에서 가장 많이 등장한 단어 TOP 20 (불용어 제외)

    문제 2. 공공 API를 활용한 데이터 수집 및 분석 (15점)

    1. API 선택 및 데이터 수집
    ① API 인증키 발급 과정
    ② 데이터 수집 코드
    2. ETL 과정 구현
    3. 데이터 시각화 및 인사이트
    ① 시각화 2가지
    ② 패턴이나 인사이트 3가지

    3. 참고문헌

    본문내용

    문제 1. 웹 스크래핑을 통한 데이터 수집 (15점)

    과제 내용:
    네이버 뉴스 또는 다음 뉴스에서 특정 키워드와 관련된 최신 기사 정보를 수집하여 분석하시오.
    요구사항:
    -데이터 수집 (7점)
    관심 있는 키워드 1개를 선택 (예: "인공지능", "기후변화", "K-팝" 등)
    BeautifulSoup 또는 Selenium을 사용하여 최근 1주일간 해당 키워드 관련 기사 50건 이상 수집
    수집 항목: 기사 제목, 날짜, 언론사, 요약문(있는 경우)
    수집 과정의 주요 코드와 설명 포함
    -데이터 처리 및 저장 (5점)
    Pandas DataFrame으로 정리
    CSV 파일로 저장
    -간단한 분석 (3점)
    일자별 기사 수 집계
    언론사별 기사 수 TOP 10
    제목에서 가장 많이 등장한 단어 TOP 20 (불용어 제외)

    requests, BeautifulSoup 모듈을 사용하여 최근 1주일간 특정 키워드(“케데헌”) 관련 기사 500건 이상 수집하고 이 데이터를 문제의 지시사항에 따라 분석하였다.

    requests 모듈은 파이썬에서 HTTP 요청을 간단하게 보낼 수 있도록 해주는 라이브러리다. 웹 서버와 데이터를 주고받을 때 자주 사용되며, GET, POST, PUT, DELETE 같은 메서드를 직관적으로 호출할 수 있다. 브라우저 없이도 웹페이지의 HTML이나 API 응답(JSON 등)을 받아올 수 있어 크롤링이나 데이터 수집에서 매우 많이 활용된다. requests 모듈의 기본적인 사용법은 다음과 같다.

    import requests

    # GET 요청
    response = requests.get("https://www.knou.ac.kr")

    # 응답 상태 코드 확인
    print(response.status_code) # 200이면 성공

    # 응답 본문 가져오기 (JSON 데이터)
    data = response.json() # 딕셔너리
    data_str = response.text # 문자열
    print(data["title"]) # 특정 필드 출력

    BeautifulSoup은 파이썬에서 HTML과 XML 문서를 쉽게 파싱하고 탐색하기 위해 사용되는 라이브러리다. 웹 크롤링 과정에서 주로 활용되며, 복잡한 태그 구조를 간단한 코드로 다룰 수 있도록 도와준다.

    참고자료

    · 한종대, 민경하(2025). 파이썬데이터처리. KNOU PRESS.
  • 압축파일 내 파일목록

    · 파이썬데이터처리.py
    · 파이썬데이터처리.hwp
    · 파이썬데이터처리.ipynb
  • 자료후기

      Ai 리뷰
      이 자료는 깊이 있는 설명과 다양한 예시 덕분에 과제를 작성하는 데 큰 도움이 되었습니다. 앞으로도 이런 유익한 자료가 계속 등록되기를 바랍니다!
    • 자주묻는질문의 답변을 확인해 주세요

      해피캠퍼스 FAQ 더보기

      꼭 알아주세요

      • 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
        자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
        저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
      • 해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.
        파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
        파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

    함께 구매한 자료도 확인해 보세요!

    “통계·데이터과학과” 연관 자료 입니다

    문서 초안을 생성해주는 EasyAI
    안녕하세요 해피캠퍼스의 20년의 운영 노하우를 이용하여 당신만의 초안을 만들어주는 EasyAI 입니다.
    저는 아래와 같이 작업을 도와드립니다.
    - 주제만 입력하면 AI가 방대한 정보를 재가공하여, 최적의 목차와 내용을 자동으로 만들어 드립니다.
    - 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
    - 스토어에서 무료 이용권를 계정별로 1회 발급 받을 수 있습니다. 지금 바로 체험해 보세요!
    이런 주제들을 입력해 보세요.
    - 유아에게 적합한 문학작품의 기준과 특성
    - 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
    - 작별인사 독후감
    해캠 AI 챗봇과 대화하기
    챗봇으로 간편하게 상담해보세요.
    2026년 02월 13일 금요일
    AI 챗봇
    안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
    8:17 오후