
학과 | 통계·데이터과학과 | 학년 | 4학년 |
---|---|---|---|
과목명 | 비정형데이터분석 | 자료 | 3건 |
공통 |
1. 개인정보, 가명정보, 익명정보의 개념을 기술하고 각 개념에 대해 구체적인 (교재 외의) 사례를 들어 비교하고 설명하시오. (9점) 2. 빅데이터 시대에 접어들어 비정형데이터 분석의 중요성이 부각되는 이유는 무엇인지 기술하고 비정형데이터 분석 상 유의점에 대해 논하시오. (6점) 3. 다음 <보기>와 같은 텍스트 데이터가 존재한다고 가정하자. 이 데이터가 맵리듀스 과정의 input 데이터라면 이후의 맵리듀스 과정은 어떻게 진행될 것인지 단계별로 도시하고 설명하시오. (단, Splitting 단계에서는 문장구조에 상관없이 첫 단어부터 시작하여 세 단어씩 나누어진다고 가정) (9점) <보기> This is a simple example of text mining algorithm This example is easy The next example is more difficult than this 4. R의 ‘rvest’ 및 ‘dplyr’ 패키지를 이용하여 관심 있는 웹페이지(교재 사례 외)의 텍스트를 읽어오는 코드를 작성하고 실행결과를 제시하시오. (6점) |
파일오류 | 중복자료 | 저작권 없음 | 설명과 실제 내용 불일치 |
---|---|---|---|
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 | 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) | 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 | 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우 |