中国国内旅游总花费影响因素分析
1 / 51
国内旅游总花费影响因素分析
一、问题提出 1、研究问题
旅游可以促进人力、物力、资源的优化利用,促进当地的相关产业的发展,解决就业问题,提高经济收益等都是大有裨益的。更重要是随着旅游业的发展,当地人的观念将会发生根本改变,即按照市场需求,组织生产,搞活流通,以信息化取代封闭的传统的生产模式。旅游可以使单一资源产生规模效应,扩大单一资源的产品转化和升级,将市场建在家门口,对外提高当地的影响力。旅游业是现代服务业的重要组成部分,带动作用大。加快旅游业改革发展,是适应人民群众消费升级和产业结构调整的必然要求,对于扩就业、增收入,推动中西部发展和贫困地区脱贫致富,促进经济平稳增长和生态环境改善意义重大,对于提高人民生活质量、培育和践行社会主义核心价值观也具有重要作用。
中国旅游业的发展是与改革开放同步进行的。改革开放之前,由于受传统计划体制观念的影响,注重生产轻视消费,旅游被当做一种奢侈品而遭到排斥,同时,国内生活水平普遍较低,对外又采取闭关锁国政策,因此,旅游产业的发展缺乏必要的物质基础和政治条件。改革开放以后,随着中国经济的发展,一方面,国民经济建设需要大量的资金;另一方面,由于对外开放的大门打开,境外游客和资本急于进入中国,从而为中国的旅游业形成创造了良好的内外条件和环境。本文通过对国内旅游总花费的影响因素展开研究,运用建立多元线性回归模型的方法,探讨影响国内旅游总花费的主要因素,并对这
2 / 51
国内旅游总花费影响因素分析
些因素进行分析。
2、数据来源(1994-2013,国家统计局)
Y国内旅游总花费(亿元) X1国内生产总值(亿元) X2平均工资(元) X3客运量(万人)x4国内游客(百万人次) x5居民消费价格指数(上年=100)
国内旅国内生产年 游总花总值(亿份 费(亿元) 元) 1994 1995 1996 1997 1998 1999 2000 2001 1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 48197.9 60793.7 71176.6 78973. 84402.3 89677. 99214.6 109655.2 5120 5348 5980 国内游平均工客运量客(百万人次) 524 629 640 居民消费价格指数(1987年=100) 270.4 396.9 429.9 .9 资(元) (万人) 7446 695 438.4 .2 9333 10834 3 / 51
744 784 434.0 437.0 国内旅游总花费影响因素分析
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 120332.7 135822.8 159878.3 184937.4 216314.4 265810.3 314045.4 340902.8 401512.8 473104. 519470.1 568845.2 12373 878 433.5 .7 5.8 4.0 .0 2 24721 28898 32244 36539 1610 1712 1902 2103 493.6 522.7 519.0 536.1 65.0 46769 51483 2957 3262 579.7 594.8 3、定性分析
为了研究国内旅游总花费的影响因素,把国内旅游总花费(亿元)作为被解释变量y,将国内生产总值(亿元)、平均工资(元)、客运量(万人)、国内游客(百万人次)、居民消费价格指数(上年=100)作为解释变量,分别设为x1,x2、x3、x4、x5,假定其多元线性回归模型表示为:
y = β0 +β1x1 + β2x2 + β3x3 +β4x4 +β5x5
二、相关分析
4 / 51
国内旅游总花费影响因素分析
1、 数据基本描述
Descriptive Statistics Mean Std. Deviation 7351.58315 1.64588E5 14745.147 8.31668E5 834.46503 N 20 20 20 20 20 国内旅游总花费(亿元) 国内生产总值(亿元) 平均工资(元) 客运量(万人) 国内游客(百万人次) 居民消费价格指数(上年7.4595E3 2.1715E5 2.01E4 2.0126E6 1.3511E3 4.6773E2 =100)
2、 相关分析
73.11847 20 利用散点图、简单相关系数检验被解释变量y和解释变量x1, x2, x3, x4, x5之间的关系。
根据散点图可以看出,国内旅游总花费y与国内生产总值x1、平均工资x2、客运量x3、国内游客x4、居民消费价格指数x5成正相关。
5 / 51
国内旅游总花费影响因素分析
Correlations
居民消
国内旅国内生游总花产总值费(亿元)
(亿
客运
国内游
费价格指数
平均工量(万客(百万(上年
元) 资(元) 人) 人次) =100) Pearson 国内旅游总花
1.000 Correla费y tion
国内生产总值
.974 1.000 x1
平均工资x2 客运量x3 国内游客x4
.968 .785 .986 .999 1.000 .875 .875 .996 .875 1.000 .994 .847 .994 .847 1.000 .891 .814 .886 .999 .875 .996 .895 .974 .968 .785 .986 .855 6 / 51
国内旅游总花费影响因素分析
居民消费价格指数(上年=100)x5
Sig.
国内旅游总花
. (1-tail费y ed)
国内生产总值
.000 x1
平均工资x2 客运量x3 国内游客x4 居民消费价格指数(上年=100)x5
N
国内旅游总花
2 费y
国内生产总值
2 x1
平均工资x2 客运量x3 国内游客x4
2 2 2 .855 .895 .891 .814 .886 1.000 .000 .000 .000 .000 .000 . .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 . .000 .000 . .000 .000 . .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 . 7 / 51
国内旅游总花费影响因素分析
居民消费价格指数(上年=100)x5
2 从相关系数表中可以看出国内旅游总花费y与国内生产总值x1、平均工资x2、国内游客x4的相关系数都在0.9以上,高度相关;国内旅游总花费y与居民消费价格指数x5的相关系数在0.8以上,相关性也很强,国内旅游总花费y与客运量x3的相关系数在0.7以上,具有一定的相关性。所以,国内旅游总花费y与这五个自变量做回归分析是合适的。
三、模型建立
根据之前建立的模型y = β0 +β1x1 + β2x2 + β3x3 +β4x4 +β5x5
,利用SPSS,采用强行进入的方法进行多元线性回归,得到结果
如下:
1、拟合优度检验
Model Summaryb Model R R AdjusStd. Error Change Statistics Durbin8 / 51
国内旅游总花费影响因素分析
Squarted R of the e SquarEstimate e R Square F Sig. -WatsoF Chann Change Change df1 df2 ge 1 .99.987 .982 987.66685 3 a207.73.987 5 5 14 .000 .584 a. Predictors: (Constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元) b. Dependent Variable: 国内旅游总花费(亿元)
从上表可以看出,方程的复相关系数R=0.993,样本决定系数R2=0.987,调整后的样本决定系数为0.982,说明方程拟合优度很好。
ANOVAb Sum of Model 1 Regressi1.013E9 on Residual 1.366E7 14 6 Total 1.027E9 19 Mean df Square F 207.735 2.026E8 5 975485.80 Squares Sig. .000a 9 / 51
国内旅游总花费影响因素分析
a. Predictors: (Constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元)
b. Dependent Variable: 国内旅游总花费(亿元)
由ANOVA表可知,在0.05的显著性水平下,F值=207.735,P值为0.000,说明回归方程高度显著,x1, x2, x3, x4, x5整体上对y有高度显著的线性影响。
回归系数的检验
10 / 51
Coefficientsa 国内旅游总花费影响因素分析 Standardized CoeffUnstandardized icienCoefficients ts Correlations ZeroStd. Model 1 B Error Beta Collinearity Statistics TolerancVIF -ordPartt Sig. er ial Part e (Constant) -2265.053283.233 国内生产总.042 值x1 平均工资x2 -.653 -.690 .502 5 .038 .934 1.088 .295 .974 .279 .034 .001 776.155 -1.31-2.22.293 0 6 -1.42-.001 .001 -.117 6 .176 .785 .043 .968 -.51-.06.003 364.442 1 9 客运量x3 -.35-.04.142 7.038 6 4 国内游客x4 居民消费价13.137 4.169 1.491 3.151 .007 .986 .644 .097 .004 235.720 -.14-.01格指数(上年=100)x5 -3.988 7.094 -.040 -.562 .583 .855 9 7 .191 5.241 11 / 51
国内旅游总花费影响因素分析
a. Dependent Variable: 国内旅游总花费(亿元)
通过表格,我们看到平均工资x2、国内游客x4的回归检验系数P值小于0.05,通过检验。而常数项、国内生产总值x1、客运量x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验。
4、残差分析——正态性检验
根据直方图和正态概率分布图可以看到,残差基本上符合正态性假设。
12 / 51
国内旅游总花费影响因素分析
5、残差分析——异方差检验
13 / 51
国内旅游总花费影响因素分析
14 / 51
Correlations
国内旅游总花费影响因素分析
国内生产总值(亿
居民消
国内游费价格
平均客运量客(百工资
(万
万人
指数(上年
ABSE 元) (元) 人)
SpearABSE man's rho
Correlation
1.000 .158 .158 Coefficient Sig.
. .506 .506 (2-tailed) N
国内生产总值x1
Correlation Coefficient Sig.
.506 (2-tailed) N
2 次) =100) .229 .156 -.008 .332 .510 .975 2 1.000*
.158 1.000 *
.967** .998** .947** . . .000 .000 .000 15 / 51
国内旅游总花费影响因素分析
平均工资x2
Correlation Coefficient Sig.
.506 (2-tailed) N
2 1.000*
.158 *
1.000 .967** .998** .947** . . .000 .000 .000 客运量x3 Correlatio
n
.229 .967** .967** 1.000 .968** .910** Coefficient Sig.
.332 .000 .000 (2-tailed) N
国内游客x4
Correlation
.156 .998** .998** .968** 1.000 .941** Coefficient Sig.
.510 .000 .000 (2-tailed)
.000 . .000 2 . .000 .000 16 / 51
国内旅游总花费影响因素分析
N 居民消费价格指数(上年Correlation 2 -.008 .947** .947** .910** .941** 1.000 Coefficien=100)x5 t Sig. .975 .000 .000 (2-tailed) N **. Correlation is .000 .000 . 2 significant at the 0.01 level (2-tailed). 由残差图可知,残差图上的点的散布是随机的,不太有规律;由Correlations表可知,残差绝对值与x1, x2, x3, x4,x5的相关系数分别为0.158,0.158,0.229,0.156,-0.08,相应的P值均大于0.05,说明残差绝对值与自变量x1, x2, x3, x4,x5之间显著不相关。故综上所述,不存在异方差。
6、自相关性检验
Model Summaryb
17 / 51
国内旅游总花费影响因素分析
Change Statistics AdjusR ted R Std. Error R F Sig. F DurbinChan-Watson SquarSquarModel R 1 .99e e of the Square Estimate Change Change df1 df2 ge 207.73.987 .982 987.66685 3 a.987 5 5 14 .000 .584 a. Predictors: (Constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元) b. Dependent Variable: 国内旅游总花费(亿元)
18 / 51
国内旅游总花费影响因素分析
从模型汇总表中可知,D.W值为0.584,查D.W表,当n=20,k=5时,dL=0.90,du= 1.83, D.W=0.584<dL,且滞后残差图呈正相关关系,所以模型存在正自相关性。
7、共线性诊断
19 / 51
Coefficientsa 国内旅游总花费影响因素分析 Standardized CoeffUnstandardized icienCoefficients ts Correlations ZeroStd. Model 1 B Error Beta Collinearity Statistics TolerancVIF -ordPartt Sig. er ial Part e (Constant) -2265.053283.233 国内生产总.042 值x1 平均工资x2 -.653 -.690 .502 5 .038 .934 1.088 .295 .974 .279 .034 .001 776.155 -1.31-2.22.293 0 6 -1.42-.001 .001 -.117 6 .176 .785 .043 .968 -.51-.06.003 364.442 1 9 客运量x3 -.35-.04.142 7.038 6 4 国内游客x4 居民消费价13.137 4.169 1.491 3.151 .007 .986 .644 .097 .004 235.720 -.14-.01格指数(上年=100)x5 -3.988 7.094 -.040 -.562 .583 .855 9 7 .191 5.241 20 / 51
国内旅游总花费影响因素分析
a. Dependent Variable: 国内旅游总花费(亿元)
Collinearity Diagnosticsa Variance Proportions 国内生DimensEigenvConditi(ConstaModel ion alue on Index nt) 1 1 2 3 4 5 6 5.622 .345 1.000 4.037 .00 .01 .01 .52 .14 .33 产总值(亿平均工客运量国内游客居民消费价(百万人格指数(上次) .00 .00 .00 .02 .46 .52 元) 资(元) (万人) .00 .00 .00 .00 .00 1.00 年=100) .00 .00 .01 .93 .01 .05 .00 .00 .00 .00 .35 .64 .00 .00 .56 .02 .22 .20 .028 14.064 .003 44.309 .001 68.413 .000 139.200 a. Dependent Variable: 国内旅游总花费(亿元)
由Coefficients表可以看出x1,x2,x4的VIF值都大于10,所以存在严重的多重共线性。由Collinearity Diagnostics表可知,自变量x2,x3,
21 / 51
国内旅游总花费影响因素分析
x4, x5的条件数均大于10,进一步说明自变量之间存在严重的多重共线性。
8、异常值检验
年 份 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 SDR_1 -0.25782 -0.98394 -0.63624 -0.04643 0.038627 0.524824 0.927193 1.451298 1.179306 1.340228 -0.14771 -0.48088 -1.45338 -2.10149 -0.76643 -0.63843 COO_1 0.23288153 0.03811258 0.01869595 1.51E-04 5.15E-05 0.00577236 0.01485042 0.03467744 0.04201566 0.09161782 9.20E-04 0.00775347 0.06653409 0.04287897 0.03293286 0.02077564 LEV_1 0.901502 0.140719 0.159692 0.230634 0.111378 0.056532 0.043058 0.046323 0.107059 0.194394 0.140573 0.109754 0.119438 0.017574 0.196119 0.176539 22 / 51
国内旅游总花费影响因素分析
2010 2011 2012 2013
-0.23033 0.398954 2.158468 0.967995 0.00978043 0.0171609 0.86018878 7.68762598 0.457713 0.328132 0.532865 0.930002 从上表可知,所有数据的删除学生化残差绝对值都小于3,除2013年库克距离都小于0.5,该模型存在异常值。 四、模型修改
1.全模型存在的问题
(1)常数项、国内生产总值x1、旅客运输平均距离x3、居民消
费价格指数x5系数检验P值均大于0.05,未通过检验; (2)存在自相关性;
(3)自变量之间存在严重的多重共线性; (4)2013年存在异常值。
2. 修改
利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。 (1)拟合优度检验
Variables Entered/Removeda
Model
Variables
Variables Entered Removed
Method
23 / 51
国内旅游总花费影响因素分析
1 国内游客(百万人Stepwise (Criteria: Probability-of-F-to-enter . <= .050, 次)x4 Probability-of-F-to-remove >= .100). 2 Stepwise (Criteria: Probability-of-F-to-enter 平均工资(元)x2 . <= .050, Probability-of-F-to-remove >= .100). a. Dependent Variable: 国内旅游总花费(亿元)
Model Summaryc Change Statistics Adjusted R R SquaDurbSig. F in-WF Changatsoe n R Std. Error re of the Estimate ChanSquarSquaModel R e re ge Change df1 df2 24 / 51
国内旅游总花费影响因素分析
1 .986 .972 .970 1269.59516 .972 a619.061 7 18 .000 2 .992b .984 .982 974.59357 .013 13.546 1 17 .002 .711 a. Predictors: (Constant), 国内游客(百万人次) b. Predictors: (Constant), 国内游客(百万人次) , 平均工资(元) c. Dependent Variable: 国内旅游总花费(亿元)
由Model Summary表可知,方程的复相关系数R=0.986,样本决定系数为R2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。
(2)回归方程显著性检验
ANOVAc Sum of Model 1 Regressi9.979E8 on Residual 2.901E7 18 25 / 51
Squares df Mean Square F Sig. 1 9.979E8 619.067 .000a 1611871.858 国内旅游总花费影响因素分析
Total 2 Regressi1.027E9 19 1.011E9 on Residual Total 1.615E7 1.027E9 2 5.054E8 532.053 949832.628 .000b 17 19 a. Predictors: (Constant), 国内游客 x4 b. Predictors: (Constant), 国内游客 x4, 平均工资 x2 c. Dependent Variable: 国内旅游总花费 y
由ANOVA表可知,在0.05的显著性水平下,F值为532.053,P值为0.000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。
(3)回归系数检验
26 / 51
国内旅游总花费影响因素分析
Coefficientsa Standardized CoeffUnstandardized icienCoefficients ts Collinearity Correlations Statistics ZeroParStd. Model B Error Beta TolerancVIF -ordtiat -7.765 24.88.98.000 .986 1 Sig. er l Part e 1 (Constant-4274.27550.44) 国内游客 8.685 x4 2 (Constant-6150.14662.05) 国内游客 8 1 .000 9 1.00.986 1.000 0 .349 .986 6 -9.289 .000 7 .8617.822 2.497 2.023 7.137 .000 .986 .217 .012 6 86.857 x4 27 / 51
国内旅游总花费影响因素分析
平均工资 -.520 x2 a. Dependent Variable: 国内旅游总花费 y
-1.04-3.68.141 3 -.6-.11.002 .968 .012 66 86.857 1 2 由Coefficients表可知,常数项、平均工资x2和国内游客x4的回归系数检验的P值均小于0.05,所以通过检验。故综上述,该问题的最小二乘回归模型为:
y = -6150.148-0.52x2+17.822x4
(4)残差分析——正态性检验
根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。
28 / 51
国内旅游总花费影响因素分析
29 / 51
国内旅游总花费影响因素分析
(5)残差分析——异方差性检验
Correlations 平均工资 ABSE x2 国内游客 x4 Spearman's ABSE rho Correlation 1.000 Coefficient Sig. . (2-tailed) N 20 20 20 .409 .420 .195 .191 30 / 51
国内旅游总花费影响因素分析
平均工资 Correlation .195 x2 Coefficient Sig. .409 (2-tailed) N 国内游客 Correlation .191 x4 Coefficient Sig. .420 (2-tailed) N 20 1.000 .998** . .000 20 20 20 .998** 1.000 .000 . 20 20 **. Correlation is significant at the 0.01 level (2-tailed).
由残差图可知,残差图上的点的散布是随机的,无任何规律;由Correlations表可知,残差绝对值与x2, x4的相关系数分别为0.195,0.191,相应的P值均大于0.05,说明残差绝对值与各自变量之间显著不相关。故综上所述,认为不存在异方差。
(6)残差分析——自相关性检验
Model Summaryc
31 / 51
国内旅游总花费影响因素分析
Model 1 2 R .986a .992b R Square Adjusted R Std. Error of Durbin-WatsSquare .970 .982 the Estimate 1269.5952 974.5936 on .972 .984 .711 a. Predictors: (Constant), 国内游客 x4 b. Predictors: (Constant), 国内游客 x4, 平均工资 x2 c. Dependent Variable: 国内旅游总花费 y D.W值为0.711,查D.W表,n=20,k=2,dl=1.20,du=1.41,D.W=0.711<dL,模型存在正自相关性,用迭代法解决。通过进一步考察自相关系数,ρ≈1-1/2D.W=1-0.5*0.711=0.6445。求出相关系数ρ后,做变量变换:
yi,= yi-ρyi-1 ;xi,= xi-ρxi-1
如果方程通过D.W 检验 , 迭代 结 束 , 否 则 , 继续 重 复 上 述 过 程,直到 通过D.W 检验 。
(7)多重线性检验
Coefficientsa 32 / 51
国内旅游总花费影响因素分析
Standardized CoeffUnstandardized icienCoefficients ts Collinearity Correlations Statistics ZeroParStd. Model B Error Beta TolerancVIF -ordtiat -7.765 24.88.98.000 .986 1 Sig. er l Part e 1 (Constant-4274.27550.44) 国内游客 8.685 x4 2 (Constant-6150.14662.05) 国内游客 8 1 .000 9 1.00.986 1.000 0 .349 .986 6 -9.289 .000 7 .8617.822 2.497 2.023 7.137 .000 .986 .217 .012 6 -1.04-3.68-.520 .141 3 86.857 86.85.012 7 x4 平均工资 x2 a. Dependent Variable: 国内旅游总花费 y 33 / 51
-.6-.11.002 .968 66 1 2 国内旅游总花费影响因素分析
Collinearity Diagnosticsa Variance Proportions DimeModensioEigenvalCondition (Constal 1 n 1 2 2 1 2 3 ue 1.857 .143 2.780 .219 .002 Index 1.000 3.600 1.000 3.564 40.430 nt) .07 .93 .01 .34 .65 国内游客(百万人次) .07 平均工资(元) .93 .00 .00 1.00 .00 .00 1.00 a. Dependent Variable: 国内旅游总花费(亿元)
由Coefficients表可知,各个自变量的VIF均大于10;由Collinearity Diagnostics表可知,共线性诊断中条件数有一个在40附近。综上述,说明自变量间存在多重共线性。为了消除共线性,接下来我们剔除解释变量x2。
(8)异常值检验
34 / 51
国内旅游总花费影响因素分析
年 份 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 SDR_2 0.528849 -1.0255 -0.55163 0.145612 0.029302 0.520868 0.982475 1.480207 0.863414 1.599435 -0.51511 -0.72747 -1.81281 -2.25004 -0.64923 -0.90362 0.305616 0.141964 0.577889 COO_2 0.011608 0.077636 0.018073 0.001036 3.78E-05 0.009422 0.027359 0.062318 0.01998 0.169012 0.005408 0.01097 0.050985 0.079433 0.032751 0.067802 0.014638 0.001743 0.048942 LEV_2 0.056533 0.131763 0.095951 0.071347 0.060696 0.040677 0.02822 0.033667 0.023388 0.12788 0.005273 0.007017 0.000155 0.005105 0.133785 0.147703 0.258001 0.146448 0.24698 35 / 51
国内旅游总花费影响因素分析
2013
1.50316 0.527717 0.379412 由上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均小于0.5,故数据不存在异常值。
五、模型修改
1.模型存在的问题
(1)自变量之间仍存在多重共线性;
2. 修改
剔除解释变量x2,利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。
(1) 拟合优度检验
Variables Entered/Removeda Variabl
Model 1
国内游客(百万人次)x4 Variables Entered
es Removed Method
Stepwise (Criteria:
Probability-of-F-to-enter <= .050, . Probability-of-F-to-remove >= .100).
36 / 51
国内旅游总花费影响因素分析
2 客运量(万人)x3 Stepwise (Criteria: Probability-of-F-to-enter <= .050, . Probability-of-F-to-remove >= .100). a. Dependent Variable: 国内旅游总花费(亿元)y Model Summaryc Change Statistics Adjusted R Std. Error SquarModel 1 .986a .972 .970 6 2 .990b .981 .978 7 a. Predictors: (Constant), 国内游客(百万人次)x4 b. Predictors: (Constant), 国内游客(百万人次)x4, 客运量(万人)x3 c. Dependent Variable: 国内旅游总花费(亿元)y 37 / 51
Sig. R F DurbinChan-Watson of the Square R R Square e Estimate Change F Change df1 df2 ge 1269.5951.972 619.067 1 18 .000 1084.5833.009 7.665 1 17 .013 .601 国内旅游总花费影响因素分析
由Model Summary表可知,方程的复相关系数R=0.986,样本决定系数为R2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。
(2)回归方程显著性检验
ANOVAc Sum of Model 1 Regressio9.979E8 n Residual 2.901E7 18 8 Total 2 Regressio1.007E9 n 2 5.034E8 427.975 .000b 1.027E9 19 Squares df Mean Square F Sig. 1 9.979E8 619.067 .000a 1611871.8538 / 51
国内旅游总花费影响因素分析
Residual 2.000E7 17 1176321.08 6 Total 1.027E9 19 a. Predictors: (Constant), 国内游客(百万人次)x4 b. Predictors: (Constant), 国内游客(百万人次)x4, 客运量(万人)x3 c. Dependent Variable: 国内旅游总花费(亿元)y
由ANOVA表可知,在0.05的显著性水平下,F值为619.067,P值为0.000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。
(3)回归系数检验
39 / 51
国内旅游总花费影响因素分析
Coefficientsa Standardized CoeffUnstandardized icienCoefficients ts Collinearity Correlations Statistics ZeroParStd. Model 1 B Error Beta -ordtiaParTolert -7.765 Sig. er l t ance VIF (Constant-4274.27550.44) 国内游客1 .000 9 24.88(百万人次)x4 2 (Constant-2916.42679.46) 6 .98.98.000 .986 1.000 6 1.000 8.685 .349 .986 1 6 -4.292 .000 2 40 / 51
国内旅游总花费影响因素分析
国内游客17.84(百万人次)x4 客运量(万-.002 人)x3 a. Dependent Variable: 国内旅游总花费(亿元)y
.97.60.000 .986 .283 4 4 3.528 9.997 .560 1.135 9 -2.76.001 -.176 9 -.5-.0.013 .785 57 94 3.52.283 8 由Coefficients表可知,常数项、平均工资x2和国内游客x4的回归系数检验的P值均小于0.05,所以通过检验。故综上述,该问题的最小二乘回归模型为:
y = -2916.426-0.002 x3+9.997x4
(4)残差分析——正态性检验
根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。
41 / 51
国内旅游总花费影响因素分析
42 / 51
国内旅游总花费影响因素分析
(5)残差分析——异方差性检验
Correlations 客运量(万E 人)x3 国内游客(百万人次)x4 SpearmanE 's rho Correlation 1.000 Coefficient Sig. . (2-tailed) .006 .036 .589** .471* 43 / 51
国内旅游总花费影响因素分析
N 客运量Correlation 20 20 20 .589** (万人)Coefficient x3 Sig. .006 (2-tailed) N 国内游Correlation .471* 客(百万Coefficient 人次)x4 Sig. .036 (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed).
1.000 .968** . .000 20 20 20 .968** 1.000 .000 . 20 20 20 由残差图可知,残差图上的点的散布是随机的,无任何规律;由Correlations表可知,残差绝对值与x3, x4的相关系数分别为0.589,0.471,相应的P值均大于0.05,说明残差绝对值与各自变量之间显著不相关。故综上所述,认为不存在异方差。
44 / 51
国内旅游总花费影响因素分析
(6)残差分析——自相关性检验
Model Summaryc Change Statistics Adjusted R Std. Error SquarModel 1 .986a .972 .970 6 2 .990 bSig. R F DurbinChan-Watson of the Square R R Square e Estimate Change F Change df1 df2 ge 1269.5951.972 619.067 1 18 .000 1084.5833.981 .978 7 .009 7.665 1 17 .013 .601 a. Predictors: (Constant), 国内游客(百万人次)x4 b. Predictors: (Constant), 国内游客(百万人次)x4, 客运量(万人)x3 c. Dependent Variable: 国内旅游总花费(亿元)y D.W值为0.601,查D.W表,n=20,k=2,dl=1.20,du=1.41,D.W=0.601<dL,模型存在正自相关性,用迭代法解决。通过进一步考察自相关系数,ρ≈1-1/2D.W=1-0.5*0.601=0.6995。求出相关系数ρ后,做变量变换:
yi,= yi-ρyi-1 ;xi,= xi-ρxi-1
45 / 51
国内旅游总花费影响因素分析
如果方程通过D.W 检验 , 迭代 结 束 , 否 则 , 继续 重 复 上 述 过 程,直到 通过D.W 检验 。
第一次迭代:
Model Summaryb Model 1 R .983a R Square .965 Adjusted R Std. Error of the Durbin-WatsoSquare .961 Estimate 646.74416 n .822 a. Predictors: (Constant), x4', x3' b. Dependent Variable: Y' D.W值为0.822,查D.W表,n=19,k=2,dl=1.18,du=1.40,D.W=0.822<dL,模型存在正自相关性,用迭代法解决。通过进一步考察自相关系数,ρ≈1-1/2D.W=1-0.5*0.822=0.0.589。求出相关系数ρ后,做变量变换:
yi,= yi-ρyi-1 ;xi,= xi-ρxi-1
第二次迭代:
Model Summaryb
46 / 51
国内旅游总花费影响因素分析
Model 1 R .966a R Square Adjusted R Std. Error of the Square .924 Estimate 519.98866 Durbin-Watson 1.765 .933 a. Predictors: (Constant), x4'', x3'' b. Dependent Variable: y'' D.W值为1.765,查D.W表,n=18,k=2,dl=1.16,du=1.39,du (7)多重线性检验 Coefficientsa Standardized CoeffUnstandardized icienModel Coefficients ts t Sig. Correlations Collinearity Statistics 47 / 51 国内旅游总花费影响因素分析 Zero-oStd. B 1 (Constant-4274.27) 国内游客24.88(百万人次)x4 2 (Constant-2916.42) 国内游客17.84(百万人次)x4 客运量(万-.002 人)x3 a. Dependent Variable: 国内旅游总花费(亿元)y TolerancVIF rdePartError Beta r ial Part e -7.765 550.449 1 .000 .98.000 .986 .986 6 1.001.000 8.685 .349 .986 1 0 -4.292 679.462 6 .000 .98.000 .974 .604 .283 6 3.528 9.997 .560 1.135 9 -2.76.001 -.176 9 .78-.55-.09.013 5 3.52.283 8 7 4 Collinearity Diagnosticsa 48 / 51 国内旅游总花费影响因素分析 DimVariance Proportions 客运量(万人)x3 ensEigenvaluCondition (Consta国内游客(百Model ion 1 1 2 2 1 2 3 e 1.857 .143 2.829 .146 .026 Index 1.000 3.600 1.000 4.406 10.527 nt) .07 .93 .01 .51 .48 万人次)x4 .07 .93 .01 .21 .78 .00 .00 .99 a. Dependent Variable: 国内旅游总花费(亿元)y 由Coefficients表可知,各个自变量的VIF均小于10;由Collinearity Diagnostics表可知,共线性诊断中条件数均在10附近。综上述,说明自变量间不存在多重共线性。 (8)异常值检验 年 份 1994 1995 SDR_3 0.383726 -0.1624 COO_3 0.00671 0.001079 LEV_3 0.064931 0.053715 49 / 51 国内旅游总花费影响因素分析 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 0.088626 0.620679 0.475016 0.691506 0.911909 0.943625 0.484398 0.121457 -0.5953 -0.98458 -1.62555 -1.99794 -0.98148 -1.30126 -0.44288 1.405522 2.484153 -0.39597 2.94E-04 0.013171 0.007252 0.014715 0.02368 0.02398 0.005874 3.78E-04 0.007149 0.017788 0.042543 0.06594 0.052948 0.088227 0.016813 0.180135 0.663457 0.747914 0.045737 0.039965 0.034271 0.032136 0.027986 0.024308 0.016925 0.017594 0.005019 0.002087 3.02E-04 0.005069 0.091292 0.089923 0.146778 0.174356 0.246094 0.881511 由上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均小于0.5,故数据不存在异常值。 综上所述,该问题的回归模型是: 50 / 51 国内旅游总花费影响因素分析 y = -1693.9-0.002 x3+9.997x4 四、回归方程的经济意义分析 从所得到的回归方程可以看出,影响国内旅游总花费的因素主要有国内游客人数和客运量。由回归系数表可以看出,对国内旅游总花费影响最明显的是国内游客人数,客运量的影响相对较小。在其他因素不变的情况下,国内游客每增加一百万人,国内旅游总花费增加9.997亿元。建立模型过程中删除了国内生产总值、居民消费价格指数和人均收入三个因素,说明这三个因素对国内旅游总花费的影响不如前两者明显,这也很符合现实意义。 51 / 51 因篇幅问题不能全部显示,请点此查看更多更全内容