*다* 스토어

*다*

개인인증

팔로워0 팔로우

소개

등록된 소개글이 없습니다.

전문분야 등록된 전문분야가 없습니다.

판매자 정보

학교정보

입력된 정보가 없습니다.

직장정보

입력된 정보가 없습니다.

자격증

입력된 정보가 없습니다.

판매지수

판매중 자료수

55개
전체 판매량

347개
최근 3개월 판매량

1개
자료후기 점수

평균A
자료문의 응답률

-

전체자료 55개

독후감 - 책을 지키려는 고양이

책을 지키려는 고양이[나쓰카와 소스케 장편소설]나는 왜 책을 읽는 걸까.주변에서는 늘 이렇게 말했다. 책을 통해 견문을 넓힐 수 있고 똑똑한 사람이 될 수 있다고 말이다. 나는 그런 사람이 되기 위해 무조건 책을 많이 읽으려고 했다. 하지만 쉽지 않았다. 등장인물이 많이 나오기라도 하는 책은 누가 누군지 구분하기 힘들어 반복해서 앞장으로 되돌아갔다가 다시 진행 중인 이야기로 돌아오는 행동을 반복했고, 그러다 보면 머릿속이 혼란스럽고 답답한 느낌 때문에 대충 읽다 손을 놓게 되는 일이 다반사였다.그러던 중에, 책을 끝까지 그리고 제대로 읽어야만 하는 이유가 생겼다. 1년 전, 책과 책 읽기를 정말 사랑하는 친구로부터 생일선물로 E-BOOK 리더기와 전자 도서를 선물 받았는데 정작 지금까지 읽지 못했기에 그 도서에 대한 후기를 친구에게 들려주지 못했다. 그 친구와 가끔 만나 커피 한잔할 때마다 제발 선물한 책에 관해 묻지 말아 달라는 마음과 함께 미안한 감정이 계속 나와 나를 괴롭혔다.그렇게 그 책을 시작하고 나니, 다른 책들도 마구 읽고 싶어졌다. 그다음 책이 바로 ‘책을 지키려는 고양이’였다.첫 번째 미궁에서 ‘가두는 자’는 1만 권 읽은 사람보다 2만 권 읽은 사람이 더 가치 있다고 믿었다. 하지만 내가 듣기엔 내면보다 외면을 중시하는 듯한 발언으로 들렸다. 나도 그랬다. 예전에는 겉만 보고 그것에 대한 특징, 좋다, 나쁘다 등을 판단해왔다. 하지만 그렇게 판단하고 나서 나중에 직접 그 사람이나 그 무언가에 대해 실제로 겪어보면 내가 판단했던 것이 잘못됨을 깨달았던 적이 한두 번이 아니었다. 그리고 나서는 미안했고 후회했다. 앞으로는 겉만 보고 판단하는 일이 없도록 처음엔 그 자체를 그대로 받아들이려고 노력하고 그 이후 내면을 깊게 보려고 노력하고 있다.할아버지는 “책을 많이 읽어 아무리 자식을 많이 채워도 네가 네 머리로 생각하고 네 발로 걷지 않으면 모든 건 공허한 가짜에 불과해”라고 말했다. 책을 그저 많이 읽는다는 것, 그것은 중요치 않았다. 하나를 하더라도 제대로 그리고 정확히 해내는 것, 그리고 그것을 자기화시켜 본인 것으로 만들지 않는 한 모든 건 공허한 가짜에 불과할 것이다.두 번째 미궁의 ‘자르는 자’는 결과만 중시하려는 사람 같았다. 중간 과정에 있어 느낀 감정이나 깨달음을 무시한 채 오로지 눈에 보이는 결과만을 최고로 여기는 사람.물론 목표 달성을 위한 과정들이 힘들고 어렵겠지만 실제로 나는 그런 과정에서 겪은 실수와 경험들이 이전보다 더 나은 내가 되고 있음을 몸소 체험 중이므로 ‘자르는 자’가 자신의 행동을 바꿨을 때 왠지 모르게 뿌듯했다.세 번째 미궁인 ‘팔아치우는 자’에서는 생각지도 못한 부분에서 나의 뇌리에 꽂혀 곱씹게 되는 말이 있었다.“계속 집에만 틀어박혀 있으면 마음이 먼저 패배해”이 말은 고모가 린타로에게 한 말이지만 지금 나에게 가장 필요한 말인 것만 같았다. 나는 이 말을 듣고 뜨끔했다. 내 앞에 시멘트벽이라도 있는 듯, 계속 떨어지는 현실 속에서 자신감은 이미 바닥인 듯하다. 린타로에게 있는 얼룩 고양이와 고모와 같은 존재가 실제로 내 옆에 있었으면 좋겠다. 나의 방향을 조금이라도 찾을 수 있게 도와줬으면 좋겠다.

독후감/창작| 2020.05.10| 2페이지| 1,000원| 조회(134)

독후감, 독서감상문, 독서, 책을 지키려는 고양이

미리보기

닫기
독후감 - 꿀벌과 천둥 평가C아쉬워요

꿀벌과 천둥[온다 리쿠 장편소설]요시가에 국제 피아노 콩쿠르가 진행되는 순간을 담은 책으로, 짧으면 짧다고 느껴질 수 있지만, 그 짧은 시간에 각기 다른 사람들로부터 깨달음, 희망, 용기, 질투를 느낄 수 있었다. 마치 나의 삶 속에서 깨달음과 감정을 느끼는 것처럼 그들도 마찬가지로 말이다.각기 다른 사연을 가진 피아니스트들이 연주하는 클래식 음악을 글로 이해하기란 어려울 것으로 생각했다. 하지만 진 가자마에게 던져진 문제는 해결되었다는 생각이 들 정도로 이 책에서 묘사하는 클래식 음악은 마치 소설 속에서 다른 소설이 펼쳐진 것과 같은 상상이 들었다. 그러나 음악은 무형이지만 책은 글로 읽힐 수 있는 유형이기 때문에 아마도 쉽게 접할 수 있었다고 말할 수 있을 것이다. 아는 만큼 보인다는 말도 있듯이 클래식 음악에 대해 무지한 내가 글로는 음악을 이해하고 새롭게 펼쳐진 음악 속 세상을 맞이했을지 모르지만, 실제 귀로 음악을 접했을 때도 과연 내가 클래식 음악 속에 펼쳐진 세상이 그려질까? 라는 의문이 들었다. 이 의문은 직접 경험해보지 않는 한 풀리진 않겠지.‘어떻게 하면 음악을 넓은 곳으로 데리고 나갈 수 있을까?’진 가자마는 이 문제를 풀기 위해 고민했다. 나는 이 문제의 답을 도가시와 꽃꽂이를 하며 나눈 대화에서 찾았다고 생각한다.영원은 순간이고, 순간은 영원이다.곱씹게 되는 문장이었다. 영원한 것은 없다. 그래서 영원은 순간이다. 하지만 그 순간만큼은 영원할 수 있다. 순간만큼은 영원할 수 있는 것, 그건 아마도 하나에 매료되어 집중할 수 있는 것이 아닐까?진 가자마는 다른 피아니스트들과는 달랐다. 천재 소년이라 불릴 정도의 실력을 갖췄고 그는 자기가 좋아하는 일을 즐겼다. 보통 주변에서 이런 말을 많이 한다. 아무리 힘든 일이여도 본인이 즐길 수 있는 일을 하라고. 그도 아마 그럴 것이다. 즐기면서 할 수 있는 좋아하는 일이었기에 남과 비교하지 않았고 피아노가 없는 상황에서도 오롯이 그것을 여유롭게 즐기고자 했다. 그러면서 사사했던 유지 폰 호프만이 던져준 문제를 풀기 위해 끊임없이 고민했다. 그는 아마 자신이 가진 그 여유 속에서 주변을 둘러볼 힘을 가질 수 있었고 그것을 통해 식견이 넓어지면서 그 문제를 풀 수 있었을 것이다.책 속에 등장하는 피아니스트들은 다들 사연을 가지고 있었다. 직장인이면서 한 가정의 아버지인 다카시마 아카시는 콩쿠르에 최고령자로 출전하였고 피아니스트로서의 가능성을 인정받아 콩쿠르에서 수상까지 할 수 있게 되었다. 그 나이에 도전하기가 쉽지 않았을 텐데 나는 그의 행동에서 용기를 보았고 그는 피아니스트로서의 희망을 품을 수 있게 되었다.

독후감/창작| 2020.05.10| 2페이지| 1,000원| 조회(168)

독후감, 독서감상문, 독서감상, 꿀벌과 천둥

미리보기

닫기
ADSP대비 요점정리(4과목 데이터 분석中 3장 정형 데이터 마이닝)

제 4과목. 데이터 분석제 3장. 정형 데이터 마이닝제 1절. 데이터 마이닝 개요데이터 마이닝? 흔히 ‘데이터 베이스에서의 지식발견’ 이라 불림? 거대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 과정데이터 마이닝 대표적 6가지 기능1. 분류(Classification)- 새롭게 나타난 현상을 검토하여 기존의 분류, 정의된 집합에 배정하는 것을 의미(예/아니요)- 의사결정나무2. 추정(Estimation)- 수입, 수준, 신용카드 잔고 등 연속된 변수의 값을 추정하는 데 사용(가족 구성원의 총 수입)- 신경망 모형3. 예측(Prediction)- 미래 양상 예측하거나 미래 값 추정- 장바구니 분석, 의사결정나무, 신경망4. 연관 분석(Association Analysis)- 같이 팔리는 물건과 같이 아이템의 연관성을 파악하는 분석5. 군집(Clustering)- 이질적인 모집단을 동질성을 지닌 그룹 별로 세분화하는 것을 의미6. 기술(Description)-데이터가 가지고 있는 의미를 단순하게 기술하는 것도 의미 파악하는 것만큼 중요데이터 마이닝 추진 단계목적 정의-> 데이터 준비-> 데이터 가공 ->데이터 마이닝 기법 적용 ->검증데이터 분할데이터 마이닝을 적합한지 검증할 때 데이터를 구축용과 검정용, 시험용으로 나눈다. 이러한 분석 검증 방법을 무엇이라 하는가제 2절. 분류 분석로지스틱 회귀모형- 반응변수가 범주형인 경우 적용(성공/실패, 예/아니요, 남/여, 등 2가지 범주가 기본)- 새로운 설명변수(또는 예측변수)값이 주어질 때 반응변수의 각 범주에 속할 확률을 추정- str() : 행,열, 오브젝트개수, 변수개수 등 전체적인 정보 파악- glm() : 일반화선형모형, lm() 함수와 유사하나, 추가로 familly라는 인수 지정예) glm(종속변수~독립변수, data=a, family=binomial)? binomial : 이항분포- coef() : 회귀결과 도출- exp() : 지수로그 함수- 오즈(odds)의 관점에서 해석될 수 z가 여러 개로 주어지고, 목표치가 다범주인 경우 각 범주에 속할 사후 확률 제공⑤ tanh 함수⑥ 가우스 함수- nnet() : 인공신경망 패키지 내 함수- compute() : 각 뉴런의 출력값 계산2) 다층신경망 : 입력층은 자료 벡터 또는 패턴 받아드림 -> 은닉층은 이전층으로부터 출력받아 가중을 취함 -> 비선형의 활성함수로 넘김 -> 출력층은 최종 은닉층으로부터 결과를 받아 목표값 제공( =다층 퍼셉트론)- 가중치는 학습과정에서 오차의 역전파 알고리즘을 통해 갱신- 역전파(back-propagation) 알고리즘1) 인공신경망 모형에서 나옴2) 인공신경망 모형의 학습과정에서 가중치를 갱신하는데 사용되는 대표적인 알고리즘- 장점① 변수의 수가 많거나 입출력변수 간 복잡한 비선형관계가 존재할 때, 유용② 잡음에 대해 민감하게 반응하지 않음- 단점① 결과에 대한 해석이 쉽지 않음② 은닉층의 수와 은닉노드 수 결정이 어려움③ 초기값에 따라 전역해가 아닌 지역해로 수렴할 수 있음④ 모양이 복잡하면 훈련과정에 많은 시간이 소요될 수 있음.의사결정나무모형- 의사결정 규칙을 나무(tree)구조로 나타내어 전체 자료를 몇 개 소집단으로 분류 or 예측하는 분석 방법- 맨위: 뿌리마디 / 상위: 부모마디 / 하위: 자식마디 / 최종마디- 가지분할 : 나무의 가지를 생성하는 과정- 가지치기 : 생성된 가지를 잘라내어 모형을 단순화하는 과정- 의사결정나무분석의 분류 기준변수1) 이산형 목표변수(분류나무) : 카이제곱 통계량의 p-값, 지니 지수, 엔트로피 지수 등이 사용2) 연속형 목표변수(회귀나무) : ANOVA F-통계량의 p-값, 분산의 감소량- 지니지수1) 지니지수 높으면 높은 다양성, 낮은 순수성2) 지니지수 낮으면 낮은 다양성, 높은 순수성- rpart() : 의사결정나무 분석 수행- ctree() : 의사결정나무 모형 적용(이후 plot() 적용한다면 가지 쳐서 최종마디에 그래프 올라가는 모양)- 장점1) 구조가 단순하여 해석 용이2) 유용한 입력변수의 파관리 등 다양한 분야에서 활용- 예) 고객 타겟팅, 신용점수화, 캠페인 반응분석 등=> 의사결정나무모형은 인과관계를 알 수 없다.앙상블 모형- 여러개의 분류 모형에 의한 결과를 종합하며 분류의 정확도를 높이는 방법1) 배깅- 원 데이터 집합으로부터 크기가 같은 표본을 여러 번 단순임의 복원 추출하여 각 표본에 대해 분류기를 생성한 후 그 결과를 앙상블하는 방법2) 부스팅- 재표본 과정에서 각 자료에 동일한 확률을 부여하는 것이 아니라, 부여가 잘못된 데이터에 더 큰 가중을 두어 표본 추출? 아다부스팅 : 가장 많이 사용되는 부스팅 알고리즘- pairs() : 예측변수들의 조합별로 분류된 결과를 그려줌. (maxvar= 옵션을 통해 변수의 수를 지정할 수 있다)3) 랜덤포레스트- 배깅에 랜덤과정을 추가한 방법- 원자료로부터 붓스트랩 샘플을 추출하고 각 샘플에 대해 트리를 형성해 나가는 과정은 배깅과 유사하나,- 각 노드마다 모든 예측변수 안에서 최적을 분할(split)을 선택하는 방법대신 예측변수들을 임의로 추출하고, 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법을 사용- 새로운 자료에 대한 예측(분류는 다수결로, 회귀는 평균을 취하는 방법으로)- randomForest() : 랜덤포레스트 분석 수행 (=cforest())- importance() 와 varImpPlot()으로 변수의 중요성을 알 수 있음모형 평가- 일반화의 가능성, 효율성, 예측과 분류의 정확성으로 구분1) 일반화의 가능성- 같은 모집단 내 다른 데이터에 적용하는 경우에도 안정적결과 제공, 데이터 확장하여 적용할 수 있을 지에 대한 평가 기준2) 효율성- 얼마나 효과적으로 구축되었는지 평가, 적은 입력변수를 필요로 할수록 효율성 높다고 할 수 있음3) 예측과 분류의 정확성- 안정적이고 효율적인 모형을 구축하였다 하더라도 실제 문제에 적용했을 때 정확하지 못한 결과만을 양산한다면 그 모형은 의미를 가질 수 없다.- 과적합화 : 분류 분석 모형 평가 위해 훈련용 자료와 검증용 자료를 추출.: 데이터 사이즈 동일한 k개 하부집합 나누고 -> k번째 하부집합을 검증용 자료로-> 나머지 k-1개 하부집합을 훈련용자료로 사용 -> 이를 k번 반복측정3) 붓스트랩- 평가를 반복한다는 측면에서 교차검증과 유사하나, 훈련용 자료를 반복 재선정한다는 점에서 차이가 있음- 관측치를 한 번 이상 훈련용 자료로 사용하는 복원 추출법에 기반- 분류모형평가1) 오분류표 : 실제 범주와 예측된 범주 사이 관계 표현 표- 정분류율 : 전체 관측치 중 실제값과 예측치가 일치한 정도- 오분류율 : 전체 관측치 중 실제값과 예측치가 다른 정도- 민감도 : 실제 값이 true인 관측치 중 예측치가 적중한 정도- 특이도 : 실제 값이 false인 관측치 중 예측치가 적중한 정도- 정확도 : true로 예측한 관측치 중 실제 값이 true인 정도- 재현율 : 민감도와 동일한 지표로 모형의 완전성을 평가하는 지표2) ROC 그래프- 레이더 이미지 분석 성과 측정 위해 개발된 ROC 그래프- 두 분류 분석 모형을 비교 분석 결과를 가시화 할 수 있음- ROC() : 예측결과값 기반으로 ROC 그래프 작성① x축=1 y축=1 => true② x축=0 y축=0 => false③ x축=0 y축=1 => 1(=완벽한 모형)3) 이익도표와 향상도 곡선- 이익 : 개체들이 각 등급에 얼마나 분포하고 있는지를 나타내는 값- 향상도곡선 : 해당 모델의 성과가 얼마나 향상되었는지를 각 등급별로 파악하는 그래프제 3절. 군집 분석군집 분석별도의 반응 변수 필요없음. 오로지 개체 간 유사성에만 기초하여 군집 형성계층적 군집- 가장 유사한 개체를 묶어나가는 과정 반복 -> 원하는 개수의 군집 형성- 각 개체는 하나의 군집에만 속하게 됨- 군집간 연결법 (최단연결법, 최장연결법, 평균연결법, 중심연결법, 와드연결법)1) 최단연결법 : 거리의 최소값, 사슬 모양 생길 수 있으며 고립된 군집찾는데 중점 둔 방법2) 최장연결법 : 최대값, 군집들의 내부 응집성에 중점 둔 방법3) 중심연결법 : 두 군집의 중심 간 mona()- 계층적 군집결과 : 덴드로그램 형태로 표현- cutree() : tree의 높이나 그룹의 수를 옵션으로 지정하여 원하는 수의 그룹으로 나눌 수 있음- 특징1) 군집 형성 매 단계에서 지역적(local) 최적화를 수행해나가는 방법 사용하므로 그 결과가 전역적인(global) 최적해라고 볼 수 없다.2) 한 번 군집 형성 시 군집에 속한 개체는 다른 군집으로 이동 xk-평균 군집- 원하는 군집 수(k개)만큼 초기값 지정 -> 각 개체를 가까운 초기값에 할당하여 군집형성 -> 각 군집 평균 재계산하여 초기값갱신 -> 갱신값에 대해 위의 할당과정 반복하여 k개의 최종군집 형성- 탐욕적 알고리즘으로 간주 : 군집 중심으로부터 오차제곱합을 최소화하는 방향으로 군집 형성- 안정된 군집은 보장하나 전체적으로 최적이라는 것은 보장하지 못함.- 장점1) 알고리즘이 단순2) 빠르게 수행됨3) 계층적 군집보다 많은 양의 자료 다룰 수 있음4) 거리 계산에 기반하므로 연속적이여야함-단점1) 잡음이나 이상값에 영향 많이 받음2) 볼록한 형태가 아닌 군집(U-형태)의 경우 성능이 떨어짐- kmeans() : k-평균군집 수행(=kcca()와 =cclust()함수와 같음)- 군집 수 정하기 : wssplot(), Nbclust()- k-평균군집에 사용되는 함수들 : kmeans, kcca, cclust혼합 분포 군집- 모형 기반의 군집 방법- 추정된 k개 모형 중 어느 모형으로부터 나왔을 확률이 높은지에 따라 군집 분류 이루어짐- 혼합분포에 대한 최대가능도 추정을 위해 EM 알고리즘 이용- EM알고리즘1) 군집 분석의 혼합 분포 군집에서 사용하는 알고리즘2) 임의의 파라미터 값을 정함 -> 기대치를 계산 -> 이를 이용하여 파라미터를 추정하는 과정을 가능도(likehood)가 최대일 때까지 반복하여 파라미터 추정값을 도출 (임의의 파라미터 = 잠재변수)3) 혼합분포에 대한 최대가능도추정을 위해 사용4) EM알고리즘 반복수행을 통해 모수의 추정과정을 볼 수 있음5) 잠재변수상화함

컴퓨터/IT| 2020.05.10| 7페이지| 2,000원| 조회(192)

족보, 요점정리, 자격시험, 데이터분석, 데이터분석준전문가, ADSP, 정형 데이터..

미리보기

닫기
ADSP대비 요점정리(4과목 데이터 분석中 2장 통계 분석)

제 4과목. 데이터 분석제 2장. 통계 분석제 1절. 통계학 개론모집단과 표본? 모집단- 유용한 정보의 대상이 되는 것- 총조사와 표본조사로 나뉨? 총조사- 모집단의 개체 모두를 조사하는 방법? 표본조사- 모집단의 일부분만 조사하여 추론? 표본- 모집단의 일부분, 실제 추출된 집단? 표본공간- 통계적 실험을 실시할 때 나타날 수 있는 모든 결과들의 집합? 모수- 모집단에 대해 알고자 하는 값표본추출의 방법1) 단순랜덤추출법- n개의 번호를 임의로 선택해 해당 원소를 표본으로 추출2) 계통추출법- N개 원소로 구성된 모집단에서 k개씩 n개구간 나누고 첫 구간에서 하나 임의 선택 후 k개씩 띄어 표본 추출3) 집락추출법- 모집단이 집락(cluster)의 결합으로 구성돼있는 경우 일부 집락을 랜덤으로 선택하고 선택된 각 집락에서 표본 임의 선택4) 층화추출법- 각 계층 고루 대표할 수 있게 표본 추출. 이질적 모집단 원소를 유사한 것. 기리 몇 개의 층(stratum)으로 나눈 후 각 층에서 랜덤하게 표본 추출자료의 종류? 명목척도(nominal scale) : 측정대상이 어느 집단에 속하는지 분류할 때 사용(남/여, 출생지)? 순서척도(ordinal scale) : 측정대상 특성의 서열관계를 관측하는 척도(아주좋다, 좋다. 그저그렇다)? 구간척도(interval scale) : 측정대상이 갖은 속성의 양 측정. 관측값 사이 비율 의미×(온도)? 비율척도(ratio scale) : 절대적 기준값(0) 존재, 사칙연산 가능. 가장 많은 정보 갖는 척도 (무게,나이,가격)?질적자료 : 명목척도, 순서척도?양적자료 : 구간척도, 비율척도통계적 추론특정한 집단이나 불확실한 현상을 대상으로 자료를 수집해 대상 집단에 대한 정보를 구하고 적절한 통계분석방법을 이용해 의사결정을 하는 과정기술통계수집된 자료를 정리·요약하기 위해 사용되는 기초통계확률특정사건이 일어날 가능성의 척도점추정모수가 특정한 값일 것이라고 추정하는 것가설 검정? 모집단에 대한 어떤 가설을 설정한 후 표본관찰택여부 결정? 검정하고자 하는 모집단의 모수에 대한 가설 설정이 가장 기본적제 2절. 기초 통계 분석용어? 종속변수(반응변수,y) : 다른 변수의 영향을 받는 변수? 독립변수(설명변수,x) : 영향을 주는 변수? 산점도(scatter plot) : 좌표평면 위에 점들로 표현�맴餐� �� 註맴�산점도 만들고 확인해 볼 점1) 두 변수 사이에 선형관계가 성립하는지 여부2) 이상값 존재 유무3) 집단의 개수? 인과관계 유무 (x) -> 산점도에서 영향을 주는 변수의 유무는 알 수 없음.회귀분석하나나 그 이상의 변수들이 또 다른 변수에 미치는 영향에 대해 추론할 수 있는 통계기법가정선형성(독립변수의 변화에 따라 종속변수도 일정크기로 변화)독립성(잔차와 독립변수의 값이 관련돼 있지 않음)등분산성(독립변수의 모든 값에 대해 오차들의 분산이 일정)비상관성(관측치들의 잔차들끼리 상관이 없어야 함)정상성(잔차항이 정규분포를 이뤄야 함)summary()? data에 대한 전체적인 기초통계량 보고자 할 때 사용하는 함수? 각 변수의 이름과 변수에 대한 전체적인 기초통계량 알 수 있음? head() : header를 비롯한 데이터가 보이는데 기본값은 6개함수 문제- average() 라는 함수는 존재하지 않음- mean() : 평균 구하는 함수- mean(hi$birth) : hi라는 데이터에서 birth컬럼의 평균을 구하고자 할 때rnorm()rnorm(생성할 난수 개수, 평균, 표준편차) : 정규분포 함수lm()lm(종속변수~독립변수, data= ) : 회귀모델 생성 함수회귀분석의 종류1) 단순회귀 : 설명변수가 1개, 직선, y=ax+clm(y~x, data=dfrm)------------------------Coefficients:(Intercept) x2.213 2.979------------------------y=2.979x+2.2132)다중회귀 : 설명변수가 k개, 선형, y=ax+3z+clm(y~u+v+w)------------------------Coeffntercept) u v w3.0417 0.1232 1.9890 -2.9978------------------------y=3.0417+0.1232u+1.9890v-2.9978w3) 다항회귀 : 설명변수가 k개, y=ax+bx^2+clm(dist~speed+speed2, data=cars) # spped2는 speed값을 따로 제곱해서 만들어준 것------------------------Coefficients:(Intercept) speed speed22.47014 0.91329 0.09996------------------------dist=2.47014+0.91329speed+0.09996speed2단계적 변수선택 방법1) 전진선택법- 상수모형으로부터 시작해 중요하다고 생각되는 설명변수부터 차례로 모형에 추가step(lm(Pemax~1, Bio), scope=list(lower=~1, upper=~나이+키+체중+BMP+RV+FRC+TLC), direction="forward")2) 후진제거법- 가장 적은 영향을 주는 변수부터 하나씩 제거step(lm(Pemax~나이+키+체중+BMP+RV+FRC+TLC, data=Bio), direction="backward")3) 단계별 방법- 전진선택법에 의해 변수 추가하면서 단계별로 추가 또는 제거step(lm(Pemax~1, Bio), scope=list(lower=~1, upper=~나이+키+체중+BMP+RV+FRC+TLC), direction="both")? 순차적 방법 (x) -> 이런 용어는 없음.? step() : 변수를 쉽게 자동으로 선택할 수 있음. 자동으로 계산 끝까지 해줌제 3절. 다변량 분석상관 분석? 상관분석 : 데이터 안의 두 변수 간의 관계 파악을 위해 상관계수 이용함.? 1(-1)에 가까울수록 강한 양(음)의상관관계를 나타내고 상관관계 없으면 r=0피어슨의 상관계수? cor() : 선형관계만 표현? 등간척도 이상으로 측적되는 두 변수들 간의 상관관계 측정스피어만 상관계수? rcorr() : 함? 서열척도인 두 변수들의 상관관계를 측정하는 데 사용다차원 척도법? 여러 대상 간의 관계에 대한 수치적 지료를 이용해 유사성에 대한 측정치를 상대적 거리로 시각화 하는 방법? cmdscale()주성분분석? 상관관계가 있는 고차원 자료 -> 저차원 자료로 변환시키는 방법? 자료를 축약시키는데 주로 사용? 데이터 내부 구조를 파악할 수 있는 방법으로 예측모델 만들 때 주로 사용? princomp() : 주성분분석에 사용되는 함수? loadings(fit) : 주성분들의 로딩 벡터를 보여줌제 4절. 시계열 예측정상성? 시점에 상관없이 시계열의 특성이 일정하다는 것을 의미1) 평균이 일정2) 분산, 공분산 둘 다 시점에 의존하지 않는다.3) 공분산은 단지 시차에만 의존한다.차분과 계절차분? 차분 : 현 시점의 자료값 - 전 시점의 자료값 -> diff()? 계절차분 : 여러 시점 전 자료를 빼는 것.백색잡음과정? 대표적 정상 시계열? 시계열 분석에서 오차항을 의미decompose()? 시계열 자료를 4가지 요인으로 분해 가능시계열 모형? 자기회귀모형(AR모형)- 현 시점의 자료가 p 시점 전의 유한개의 과거 자료로 설명될 수 있다는 의미- 백색잡음과정? 이동평균모형(MA모형)- 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현되었기 때문에 항상 정상성을 만족- 항상 정상성 만족하므로 정상성 가정이 필요 없음? 자기회귀누적이동평균모형(ARIMA 모형)- 비정상시계열 모형으로 차분이나 변환을 통해 AR/MA/ARMA로 정상화 가능? 분해 시계열- 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법- 시계열 구성 요소1) 추세요인(trend factor) : 자료가 어떤 특정한 형태를 취할 때2) 계절요인(seasonal factor) : 고정된 주기에 따라 자료가 변화3) 순환요인(cyclical factor) : 알려지지 않은 주기를 가지고 자료가 변화4) 불규칙요인(irregular factor) : 회귀분석에서 오차에 해당하는 요인Exer 기초통계량 구하기 : summary(data명)->최소값, 중앙값, 평균, 최대값을 여기서 다 구할 수 있음- 분산 구하기 : var(data명$각 변수명)- 표준편차 구하기 : sd(data명$각 변수명)문제 2.- profits에 따른 salary에 대한 산점도 그리기1) 산점도 그리기 : plot()2) profits에 따른 이므로 x로 잡고 salary를 y로 잡음3) plot(firm$profits, firm$salary)- 산점도 그린 후 상관계수 구하기1) 상관계수 구하기 : cor()2) cor(firm$profits, firm$salary)문제 3.- profits에 따른 salary에 대한 단순 선형 회귀 식 구하기1) 회귀모델 생성하기 : lm(종속변수~독립변수, data=____)2) salary는 profits에 영향 받는 변수이므로 종속변수로 취급3) lm(salary~profits, data=firm)Coefficients:(Intercept) profits3024.1107 0.16754) 추정된 회귀식 : salary = 3024.1107 + 0.1675profits- 식 분석5) summary(lm(salary~profits, data=firm))F-statistic: 1.806 on 1 and 18 DF, p-value: 0.19576) 유의수준 0.05(5%) 하에서 p-value가 0.1957 > 0.05 이므로 추정된 회귀식이 통계적으로 유의하지 않음.문제 4.- profits과 age, sales에 따른 salary의 회귀식 구하기1) ~에 따른 salary의 회귀식 이므로 salary가 종속변수2) lm(salary~profits+age+sales), data=firm)Coefficients:(Intercept) profits age sales-4.569e+03 2.340e-01 1.274e+02 -5.650e-033) 추정된 회귀식 : salary = 0.004569 + 0.234profits+0.01274age-0

컴퓨터/IT| 2020.05.10| 7페이지| 2,000원| 조회(231)

족보, 요점정리, 자격시험, 데이터분석, 데이터분석준전문가, ADSP

미리보기

닫기
DID(Digital Information Display)를 활용한 고객 맞춤형 서비스 사업

1. 제안사업 개요사업 개요현재 소비자들의 욕구가 다양해지고 있다. Starbucks의 고객 맞춤형 커피 제공을 위한 Personal Option 기능이 추가된 나만의 메뉴 서비스 또는 유통업계의 카테고리 킬러 매장 구축을 통해 다양하고 구체화된 소비자들의 욕구를 충족시키려는 노력이 진행중이다. 롯데정보통신은 소비자 접점이 큰 유통계열사 중 IT Trend 기술 적용범위가 넓은 롯데마트와 4차 산업혁명에 대비하기 위한 미래형 마트 구축 사업을 제안한다.소비자들의 다양하고 구체적인 욕구를 충족시키기 위해서는 소비자 및 구매정보 기반의 데이터 분석을 통해 고객 개개인에 적합한 맞춤형 정보를 제공하는 것이 필요하다. 고객 맞춤형 정보를 Digital Information Display(DID)를 통해 제공하고 DID와 Computer Vision 기술, 바코드 스캔 기술, 인공지능 Watson을 함께 활용하여 소비자들의 관심을 끌고 개인 성향을 반영한 맞춤형 정보를 제공하여 오프라인 매장 매출 활성화 및 고객 편의를 증대한다.서비스 기획 방안1) 중앙제어를 통한 광고 일괄 적용2) 다양한 형태로 상품 관련 광고 콘텐츠 노출3) AR(증강현실) 활용한 매장 내 상품 위치 서비스4) 상품 비교 서비스5) 인기상품 순위 서비스6) Computer Vision 기술을 활용한 고객 장보기 동선 데이터 수집7) 바코드 스캔 기술을 활용한 구체적 상품 정보 서비스8) Computer Vision 기술을 활용한 고객 밀착형 · 맞춤별 정보 서비스DID를 활용한 고객 맞춤형 서비스 개념도롯데정보통신Computer Vision 기술, 검색내용, 구매 이력 등, 관련 빅데이터 분석 및 인공지능 Deep Learning을 통해 롯데 유통계열사 매출 향상에 도움고객양방향 소통을 통해 필요한 정보를 편리하고 신속하게 획득롯데마트분석 데이터 기반, 고객 니즈를 충족시킬 수 있는 상품 출시 및 효율적인 진열대 배치를 통한 매출 활성화

경영/경제| 2017.12.18| 6페이지| 2,500원| 조회(163)

사업, 롯데마트, 활성화, 대형마트, 매출, Did, IT기획, 고객맞춤형, digit..

미리보기

닫기