1. 주제의 설정최근 십몇 년 사이 우리나라 국민들의 해외여행은 과거에 비교하여 월등히 늘어났다. 이러한 해외여행의 증가추세는 무엇을 통해 확실한 지표로 알 수 있고, 어떤 것들의 영향으로 해외여행이 증가 하게 된 것일까.우선 해외여행 증가 추세를 정확히 알기 위해서는 여행을 위해 출국하는 사람숫자나 해외여행에 의해 소모되는 경비 등으로 알 수 있을 것이다. 그리고 이러한 해외여행을 하려는 사람들은 자신들의 소득수준이나 재산, 여행하려는 시기의 환율, 여행하려는 나라의 물가나 정치적 상황, 자신의 기분이나 반드시 가야하는 이유, 여행에 필요한 시간 등 여러 가지 요인들을 고려하여 해외여행을 가게 될 것이다.나는 기간별 해외관광 지출액을 분석 대상으로 삼았고, 그것에 영향을 미치는 것들로는 국민총소득과 기간 평균 원-달러환율, 기간평균 근로자 노동시간을 변수로 설정하였다. 이 변수들은 비교적 자료 구하기가 용이하고 내 생각에는 측정이 힘들거나 불가능한 요인들과 심리적인요인들 외에는 가장 많은 영향을 미치리라 예상되는 변수들이다.2. 모형의 설정위와 같은 기본 회귀모형에서 종속변수(Dependent Variable) Yi는 분석에 있어 주된 관심사항이 되는 변수로서 뒤에 언급할 독립변수들에 의해 영향을 받아 결정될 것이라고 가정하는 변수이다. 위 식에 따라 내가 설정한 Yi는 분기별 총 해외관광 지출액(한국은행 경제통계시스템에서 국제수지-여행지급)이다.독립변수(Independent Variable)는 종속변수 Yi에 영향을 미치는 변수들로서, 내가 설정한 X1은 분기별 국민총소득(GNI), X2는 분기별 평균 원/달러환율, X3은 분기별 평균노동시간이다.샘플 한 개의 기간은 한 분기로, 기간을 1분기로 잡은 것은 한국은행과 통계청사이트의 관련 통계자료들이 1년으로 잡을시 30개 이상이 불가능한 것들이 있어서 분기로 잡았다. 샘플 수를 고려해 월별자료로 하는 것도 고려해 보았으나 유감스럽게도 GNI의 데이터가 년과 분기별로까지밖에는 존재하지 않았다. 샘플의 시작과 나인 고전적 선형회귀모형의 중요한 가정 가운데 하나가 오차항이 모두 동일한 분산을 갖는다는 가정이 붕괴될 때 발생한다. 이분산은 주로 같은 시간대의 여러 샘플들일 경우에 발생하는데, 내가 사용하는 데이터는 시계열 자료이므로 이분산 문제가 없을 것이라 본다.일반적으로 자기상관은 OLS방식에 의하여 추정된 회귀계수의 불편성이나 일치성에 영향을 미치지는 않으나 회귀계수의 효율성을 보장 못하게 된다. 예를 들어 정적자기상관의 경우 OLS방식으로 추정된 회귀계수의 표준오차는 실제보다 작은 값을 지니게 된다. 이는 결국 추정회귀계수가 실제보다 더 정확한 것으로 인식됨을 의미한다. 따라서 실제로는 영가설이 기각될 수 없음에도 불구하고 기각되는 오류가 발생하게 된다. 자기상관의 여부는 Durbin - Watson 검증을 통해 알 수 있다.5. 추정 및 검정(회귀분석)(1) 원 자료 그대로 회귀분석 할 경우TR : 총 해외관광 지출액 (단위 : 백만 달러)GNI : 국민총소득 (단위 : 십억 원)EX : 원-달러 환율 (단위 : 원/달러, 기간별 평균)AL : 해당기간의 정규직 근로자 1인당 평균 노동시간 (단위: 시간, 추가근무시간포함)회귀식을 위의 식과 같이 놓고 Eviews를 통해 회귀분석을 한 결과 아래와 같은 결과가 나왔다.Dependent Variable: TRMethod: Least SquaresDate: 06/11/09 Time: 09:32Sample: 1993Q1 2008Q4Included observations: 64VariableCoefficientStd. Errort-StatisticProb.C11402.891562.5827.2974650.0000GNI0.0226230.00151914.895070.0000EX-2.4282870.267927-9.0632260.0000AL-51.815007.000279-7.4018490.0000R-squared0.924639Mean dependent var2472.344Adjusted R-squared0.920871S. D.수를 고려하는 적합도의 다른 척도를 조정결정계수(Adjusted R²)라 하고 다음과 같이 계산한다.여기서 RSS는 설명되지 않는 변동분(e의 제곱합)이고 TSS는 총 변동분이다.RSS는 설명변수가 추가되면 감소하지만 (n-k)역시 감소하기 때문에 꼭 필요한 변수가 아니라면 변수를 늘린다고 반드시 좋다고 볼 수는 없다.내가 설정한 회귀모형의 경우 Adjusted R-squared값이 0.920871로, 수치자체도 높은 편이고 0.924639로 나온 R²값과도 크게 차이가 없어 회귀모형의 적합도가 높은 편임을 알 수 있다.⑥ 자기상관 (Durbin-Watson검증, α=0.05)자기상관은이라는 세 번째 고전적가정이 붕괴되었을 때 발생하는 것으로 자기상관의 존재 여부는 Eviews의 회귀분석 결과표에서 Durbin-Watson값을 통해 알 수 있다.자기상관 여부를 알기 위해 가설을 세워보면 귀무가설과 대립가설은 다음과 같다.H? : 자기상관이 존재하지 않는다.H₁: 자기상관이 존재한다.더빈-왓슨 검정을 위해 통계표를 보고 경계 값을 찾아보면 n=65, 유의수준 α=0.05이고 k=3일 때인 것을 알 수 있다.추정모형의 Durbin-Watson값이 1.200738이므로 이 회귀모형은 양의 자기상관관계에 빠져있음을 알 수 있다.H0 기각X4-du 4-dl2.3 2.5dl du1.5 1.7H0기각H0기각미정미정1.2(2) 각 변수들에 자연로그(ln)를 취할 경우의 회귀분석TR : 총 해외관광 지출액 (단위 : 백만 달러)GNI : 국민총소득 (단위 : 십억 원)EX : 원-달러 환율 (단위 : 원/달러, 기간별 평균)AL : 해당기간의 정규직 근로자 1인당 평균 노동시간 (단위: 시간, 추가근무시간포함)종속변수와 모든 독립변수에 자연로그를 취해서 변화율로 만들어서 회귀분석 해보았다.내가 사용한 변수들 중에는 변화율변수가 없어서 전부 ln을 적용 시켜도 상관없을듯해서 전부 적용해 보았다.Dependent Variable: TRMethod: Least SquaresDate쪽에 존재하여 전부 유의 하게 나타난다.R-squared값과 Adjusted R-squared값은 둘 다 0.90이 넘어 높은 편으로 나타났다. Durbin-Watson수치는 du기준치인 1.7을 넘고 4-du인 2.3보다는 작아서 회귀모형에서 자기상관이 나타나지 않음을 알 수 있다.(4) 과거의 값도 변수로 적용했을 경우의 회귀분석Dependent Variable: TRMethod: Least SquaresDate: 06/13/09 Time: 11:39Sample (adjusted): 1993Q2 2008Q4Included observations: 63 after adjustmentsVariableCoefficientStd. Errort-StatisticProb.C12459.702072.3536.0123440.0000GNI0.0198640.0041214.8198490.0000GNI(-1)0.0015910.0049250.3229860.7479EX-3.6858430.597230-6.1715680.0000EX(-1)1.3704980.6081602.2535170.0281AL-56.575359.346754-6.0529410.0000R-squared0.932296Mean dependent var2499.329Adjusted R-squared0.926357S. D. dependent var1437.102S.E. of regression389.9898Akaike info criterion14.86051Sum squared resid8669249.Schwarz criterion15.06462Log likelihood-462.1061F-statistic156.9799Durbin-Watson stat1.243628Prob.(F-statistic)0.000000해당 변수에 (-1)이 붙은 것이 한 분기 전의 수치를 변수 화 한 것이다.회귀식은 TR = 12459.70134 + 0.01986351468*GNI + 0.001590615723*GNI(-1) - 3.685843441*Eresid11.17286Schwarz criterion1.287429Log likelihood-34.95942F-statistic28.55142Durbin-Watson stat0.648226Prob.(F-statistic)0.000000ln을 취한 기본 회귀식에서 GNI가 제거되었을 경우의 결과이다.회귀모형의 유의함을 나타내는 F값은 27.55142로 경계값보다 높아서 회귀식 자체는 유의하지만, 환율변수의 t값과 p값이 회귀식에 영향력이 없게 나왔다. R-squared와 Adjusted R-squared값도 GNI 변수가 존재할 때의 1/2정도로 매우 낮아졌다. 이것은 해외여행지출액이 회귀모형으로 설명할 수 없는 영역이 커졌음을 의미한다. Durbin-Watson수치도 GNI가 있을 때의 반 정도밖에 안돼서, 심각한 양의 자기상관에 속해 있음을 알 수 있다.② 환율(EX)변수 제거 시Dependent Variable: LNTRMethod: Least SquaresDate: 06/12/09 Time: 20:34Sample: 1993Q1 2008Q4Included observations: 64VariableCoefficientStd. Errort-StatisticProb.C4.7323935.5099900.8588750.3938LNGNI1.5180520.14344010.583170.0000LNAL-2.8983830.811294-3.5725450.0007R-squared0.815218Mean dependent var7.647222Adjusted R-squared0.809160S. D. dependent var0.585972S.E. of regression0.255984Akaike info criterion0.158335Sum squared resid3.997188Schwarz criterion0.259533Log likelihood-2.066726F-statistic134.5594Durbin-Watson stat0.703930Prob.(F-statistic)0.000