
총 388개
-
R 언어를 이용한 데이터 크롤링 및 가공2025.04.261. R 언어 R 언어는 통계 및 데이터 분석을 위한 강력한 프로그래밍 언어입니다. R 언어를 이용하여 데이터 크롤링, 전처리, 시각화 등 다양한 작업을 수행할 수 있습니다. R 스튜디오는 R 언어를 사용하기 위한 대표적인 IDE로, 기본적인 통계 및 시각화 기능을 제공하며 다양한 패키지를 통해 복잡한 데이터 분석도 가능합니다. 2. 데이터 크롤링 데이터 크롤링은 웹 상의 데이터를 자동으로 수집하는 기술입니다. R 언어의 twitteR 패키지를 이용하면 트위터 데이터를 크롤링할 수 있습니다. 이를 통해 트위터 데이터를 수집하고 전처...2025.04.26
-
데이터 시각화, 출석수업 과제물 (2023 1학기, 30점 만점)2025.01.251. 데이터 시각화의 사례 1970년부터 2022년까지 발생한 학교 총기 사건의 피해자 데이터를 시각화한 사례는 효율적이며 명료하다. 많은 데이터를 하나의 지도에 나타내어 어느 지역에서 어떤 규모의 사고가 났는지를 한눈에 볼 수 있다. 2. 데이터 시각화의 역할 한스 로슬링의 TED 강의에서는 다양한 지표들을 활용한 동적 데이터 시각화를 통해 잘 된 데이터 시각화가 방대하고 복잡한 자료를 한눈에 명료하게 볼 수 있게 하며 데이터를 잘 인지할 수 있게 도와준다는 것을 확인할 수 있었다. 3. 포유동물의 몸무게와 뇌 무게 msleep ...2025.01.25
-
데이터 시각화의 윤리적 고려사항2025.01.041. 데이터 시각화의 현혹적 사례 최근 일부 매체에서 데이터 시각화를 통해 독자의 주목을 끌기 위해 과장된 색상 사용, 축 범위 조정, 비율 조작 등의 현혹적인 기법을 사용하는 사례가 있다. 이는 데이터의 실제 의미를 왜곡하여 독자의 인식과 판단에 부정적인 영향을 미칠 수 있다. 2. 데이터 시각화의 윤리적 고려사항 데이터 시각화 과정에서는 정보의 정확성과 공정성 확보가 매우 중요하다. 데이터 출처와 정확성에 대한 투명성 보장, 과장된 표현 및 오해 요소 지양, 개인이나 집단에 대한 편견 및 피해 방지, 독자의 비판적 사고 촉진 등...2025.01.04
-
데이터 시각화의 현혹적 사례 분석2025.01.191. 데이터 시각화의 원칙과 목적 데이터 시각화는 데이터를 그래프, 차트, 테이블, 맵 등의 형태로 보여주는 것으로, 데이터를 더욱 명확하고 강력하게 전달하며 관심과 호기심을 불러일으킨다. 데이터 시각화의 목적은 데이터를 정확하고 효과적으로 전달하는 것이며, 이를 위해 데이터 왜곡 방지, 중요 특징 강조, 비교와 상관관계 명확화, 데이터 범위와 분포 고려, 단위와 출처 명시, 색상과 모양 적절 선택 등의 원칙을 지켜야 한다. 2. 데이터 시각화 사례 분석 첫 번째 사례는 코로나19 백신 접종률과 사망률을 산점도로 나타낸 그래프로, ...2025.01.19
-
베일에 쌓인 기업 - 팔란티어 테크놀로지2025.01.281. 팔란티어 테크놀로지 개요 팔란티어는 2003년 5월에 설립된 미국의 빅 데이터 프로세싱 기업입니다. 주로 공공 정보 분석을 수행하며, 미국 정보기관들을 주요 고객으로 하고 있습니다. 기술적 기반은 PayPal의 사기 탐지 기술을 가져온 것이며, 다양한 데이터 소스를 처리하고 분석하는 능력이 뛰어납니다. 하지만 상대적으로 비용이 높은 편입니다. 2. 팔란티어 테크놀로지 창업자 팔란티어는 PayPal을 매각한 피터 틸이 대학 동창인 알렉스 카프와 스티브 코헨을 영입하여 설립했습니다. 지배구조는 이사회 중심으로 운영되고 있습니다. ...2025.01.28
-
파이썬과R 2024년 2학기 방송통신대 출석수업과제물) 교재 연습문제 3장 1번, 2번, 3번 4장 7번, 8번, 9번 8장 2번2025.01.261. R 데이터프레임 생성 R에서 데이터프레임은 data.frame 함수로 생성한다. 데이터프레임을 구성할 원소를 설정하고, 행의 이름을 지정할 수 있다. 또한 문자열을 'factor'로 처리할지 여부를 선택할 수 있다. 2. 파이썬 딕셔너리 생성 파이썬에서 딕셔너리는 키(key)와 값(value)을 매핑시킨 자료형이다. 키는 불변객체의 자료형이어야 하며, 값은 자료형의 제한이 없다. 리스트나 튜플과 같은 가변객체는 키가 될 수 없다. 3. 파이썬 데이터프레임 생성 파이썬의 판다스 라이브러리를 사용하여 데이터프레임을 생성할 수 있다...2025.01.26
-
새로운 품질 관리 7가지 도구2025.04.251. 연관도법 연관도법은 문제 해결을 위해 관련 요인들 간의 관계를 파악하는 도구입니다. 이를 통해 문제의 원인을 체계적으로 분석할 수 있습니다. 2. PDPC PDPC(Process Decision Program Chart)는 공정 중에 발생할 수 있는 문제를 사전에 예방하기 위한 도구입니다. 공정 단계별로 발생 가능한 문제와 대응 방안을 체계적으로 수립할 수 있습니다. 3. 애로우도 애로우도는 공정 간의 상호 관계를 시각적으로 표현하는 도구입니다. 이를 통해 공정 간 의존성과 병목 현상을 파악할 수 있어 공정 개선에 활용됩니다....2025.04.25
-
통계적품질관리 ) 도수분포표와 히스토그램 작성2025.05.131. 도수분포표 작성 제공된 데이터를 바탕으로 적절한 계급의 수를 정하여 도수분포표를 작성하였습니다. 계급의 수는 8개로 정하였고, 계급 폭은 0.14cm로 설정하였습니다. 도수분포표에는 계급, 도수, 누적도수, 상대도수, 누적상대도수 등의 정보가 포함되어 있습니다. 2. 히스토그램 작성 도수분포표를 바탕으로 히스토그램을 작성하였습니다. 세로 막대형 그래프를 선택하고, 데이터 레이블을 추가하여 각 계급의 도수를 표시하였습니다. 또한 축 서식을 수정하여 계급 간격을 조정하였습니다. 3. 통계량 계산 도수분포표를 활용하여 평균, 중앙값...2025.05.13
-
데이터 시각화의 현혹적 표현 사례 분석2025.01.121. 데이터 시각화의 왜곡 데이터 시각화의 왜곡은 정보의 정확한 전달을 방해하며, 때로는 잘못된 해석을 유발할 수 있다. 최근 국내 신문에서 보도된 '한국의 1인당 국민소득이 주요 7개국(G7)과의 격차가 더 벌어졌다'는 기사는 데이터 시각화의 왜곡을 잘 보여주는 사례이다. 이 기사에서 사용된 그래프는 축의 간격이 일정하지 않아 소득 격차를 실제보다 크게 보이게 하였다. 이러한 표현 방식은 데이터의 정확성과 객관성을 훼손할 뿐만 아니라, 독자들에게 과장된 인상을 줄 수 있다. 2. 현혹적 표현의 목적과 영향 현혹적인 표현의 목적은 ...2025.01.12
-
비즈니스 분석을 위한 통계 원리2025.05.061. 기술 및 추론 통계 기술 통계는 데이터를 설명하고 요약하는 데 사용되는 반면 추론 통계는 데이터를 기반으로 추론 및 예측을 수행하는 데 사용됩니다. 기술 통계에는 평균, 중앙값, 모드, 분산 및 표준 편차와 같은 측정이 포함되며 추론 통계에는 가설 테스트, 회귀 분석 및 분산 분석(ANOVA)과 같은 기술이 포함됩니다. 2. 샘플링 및 데이터 수집 샘플링은 연구에서 전체 모집단을 나타내기 위해 모집단의 하위 집합을 선택하는 프로세스입니다. 데이터 수집은 설문 조사, 실험 또는 관찰 연구와 같은 다양한 소스에서 데이터를 수집하는...2025.05.06