
학과 | 통계·데이터과학과 | 학년 | 4학년 |
---|---|---|---|
과목명 | 비정형데이터분석 | 자료 | 1건 |
공통 |
1. 역사 속에 나타난 데이터 기록의 사례를 조사하여 약술하시오. (6점) 2. 개인정보, 가명정보, 익명정보의 개념을 사례를 들어 비교하고 설명하시오. (9점) 3. 다음 <보기>와 같은 텍스트 데이터가 존재한다고 가정하자. 이 데이터가 맵리듀스 과정의 input 데이터라면 이후의 맵리듀스 과정은 어떻게 진핼될 것인지 단계별로 도시하고 설명하라. (단, Splitting 단계에서는 문장구조에 상관없이 첫 단어부터 시작하여 세 단어씩 나누어진다고 가정하자.) (9점) <보기> This is an example The example is easy Next example is more difficult than this 4. R의 ‘rvest’ 및 ‘dplyr’ 패키지를 이용하여 관심 있는 웹페이지의 텍스트를 읽어오는 코드를 작성하고 실행해 보라. (6점) |
파일오류 | 중복자료 | 저작권 없음 | 설명과 실제 내용 불일치 |
---|---|---|---|
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 | 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) | 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 | 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우 |