예측방법론 중간 보고서요약본 보고서에서는 전력 사용 데이터를 기반으로 하여 추세분석 및 평활법 분석을 시행하였다. 추세분석에서는 지시함수를 사용한 계절함수 적합 및 자기회귀오차모형을 분석 방식으로 삼았고, 평활법에서는 가법계절지수평활법과 승법계절지수평활법을 활용하여 분석을 시행했다. 지시함수를 통한 계절함수 적합은 모형 예측은 매우 높은 결정계수값을 보였으나, 오차의 자기상관관계가 남아 회귀분석의 기본가정에 위배되었고, 두 평활법은 acf그래프로 볼 때 마찬가지로 자기상관이 약간이나마 남아있었고, 예측값도 완전히 정확하다고 보기 어려웠다. 반면에 자기회귀오차모형은 결정계수 값도 매우 높았고, 잔차 그래프에서 확인했을 때 오차들도 서로 독립성을 지니고 있다고 할 수 있으므로, 가장 정확한 예측이라고 할 수 있다.본문개요데이터는 전력통계정보 시스템에서 제공한 월별 전력 데이터이다. 분석에는 월별 전력 최고 소비량인 max.usage변수를 활용하였다. max.usage변수만을 따로 추출하여 시계열로 변환한 power.data.ts시계열 자료를 추세분석 및 평활법 분석에 활용하였다. 변환한 뒤의 대략적인 그래프는 아래와 같다.다음 그래프에서 확인할 수 있는 것처럼, 자료는 상승 추세와 고저가 반복되는 계절성을 동시에 지니고 있다고 할 수 있다. 선형추세를 따라 움직이고, 동시에 계절성을 지니고 있으므로 추세분석에서 사용할 분석방법은 우선적으로 지시함수를 활용한 선형계절추세모형이라 할 수 있다.추세분석지시함수를 사용한 계절모형 적합위의 그래프처럼 시간이 지날수록 자료의 변동폭이 조금씩 커지는 양상을 보이고 있다. 따라서 로그 변환을 통해 변동폭을 균일하게 맞추어 줄 필요가 있다.로그 변환된 그래프는 다음과 같으며 전보다는 변동폭이 줄어들었다고 할 수 있다. 로그변환된 자료 역시 계절성을 띠고 있으므로 지시함수를 활용하여 모형을 적합시킬 수 있다. 이를 위해 시간의 시작점인 2005년 1월을1로 하고 매월1씩 증가하는 값을 가지도록 시간변수trend를 지정하고, 월별 자료이므로 계절성을 파악하기 위해 지시함수 12개를 지정하였다. 모수들 사이 제약조건으로 절편이 없는 모형을 적합시키며, 적합 결과는 모든 변수들이 유의미하게 나타나며, 모형식은 다음과 같다.(3.102e-02)trend+(1.094e+01)y1+(1.092e+01)y2+...(1.093e+01)y12모형의 요약도 결정계수가1, p값도0.05이하로 매우 유의미한 모형으로 나타났다. 이처럼 유의성 검정은 매우 유의한 모형으로 나타났으나, 잔차의 시계열 그림을 그려보면 아직 잔차간 자기상관관계가 남아있다고 강하게 의심이 들며, ACF와 PACF그래프로 확인해보면 아직 잔차간 자기상관 관계가 남아있다고 할 수 있다.자기회귀오차모형회귀모형은 오차가 독립이라는 가정을 기본으로 하는 분석 방법이다. 이러한 가정이 지켜지지 않으면 모수의 추정값에 오류가 생길 수 있어 최종 분석 결과에 영향을 끼칠 수 있다. 오차 간에 독립이 이뤄지지 않은 상황을 잔차에 서로 상관관계가 남아있다고 하는데, 이러한 경우엔 자기회귀오차모형을 분석에 활용하여 모형을 개선할 수 있다. 추세분석과 마찬가지로 로그변환한 자료에 절편은 0이라는 제약식을 조건으로 한 선형계절추세모형을 기본 모형으로 하여 자기회귀오차모형을 적합하였다.(2.585e-03)time+(1.093e+01)y1+...+(1.092e+01)y12적합 후의 모형은 위와 같으며, 결정계수는1로 이전과 같고, 모형도5% 유의확률 아래 유의한 것으로 나타났다.단 자기회귀모형 적합 후 잔차에 대해서는 차이가 나타났는데, 오차들끼리 일정한 규칙성을 지니던 전과는 다르게 자기회귀오차모형 적합 후에는0을 기준으로 오차가 독립적으로 분포하는 모습을 보인다.평활법평활법은 지수평활, 계절지수 평활로 나뉘어지며 지수평활법은 다시 단순지수활법, 이중지수평활법, 삼중지수평활법으로 나뉜다. 하지만 지수평활은 시계열이 일정한 주기성을 띠지 않을 때 주로 사용되는 방법이다. 이 자료는 계절성을 띠고 있으므로 계절지수평활법을 활용하여 분석을 시도한다.계절지수평활법이 자료는 시간이 지날수록 변동폭이 커지는 경향을 보이므로 승법계절지수평활법 적용하는 것이 적절한 방법이나, 비교를 위해 가법계절지수평활법도 제시하도록 한다.가법계절지수평활법와 승법평활지수 모두 유사한 예측력을 보였으나 승법평활지수의 예측이 좀 더 정확한 것으로 보인다.acf그래프에서도 큰 차이가 없는 것으로 보이지만t-test 검정 결과 두 검정 모두 오차의 평균이 0이라는 귀무가설을 기각할 수 없지만, 가법계절지수의 경우 표본의 평균이-226으로 계산되어 승법계절지수평활법보다 바람직하지 못하다 할 수 있다. 다만 두 경우 모두 파란 선 밖의 영역이 존재해 어느 정도 자기 상관성이 남아있는 점이 아쉽다고 할 수 있다.별첨: R코드#read datasetwd("C:/Users/kwang/Desktop")power.data