您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页山东省旅游入境人数分析和预测

山东省旅游入境人数分析和预测

来源:意榕旅游网
山东省旅游入境人数分析和预测

山东经济学院 陆小惠、刘慧青、钟小菡

目 录

摘要„„„„„„„„„„„„„„„„„„„„„„„3 关键词„„„„„„„„„„„„„„„„„„„„„„3 一、问题提出„„„„„„„„„„„„„„„„„„„4 二、研究对象及背景介绍„„„„„„„„„„„„„„4 三、模型的选取„„„„„„„„„„„„„„„„„„4 四、时间序列模型原理介绍„„„„„„„„„„„„„4 五、基于时间序列模型的入境旅游人数预测实例分析„„7 六、结论„„„„„„„„„„„„„„„„„„„„„14 参考文献„„„„„„„„„„„„„„„„„„„ 15

摘要

山东省是中国东部沿海的一个重要省份,它历史悠久,文物古迹众多,山川秀丽,旅游资源丰富多彩。被誉为 “五岳之尊” 的泰山和古代伟大的思想家、教育家孔子故乡曲阜的孔庙、孔府、孔林,先后被联合国教科文组织列为世界自然遗产。齐国故都临淄,“人间仙境”蓬莱,“道教圣地” 崂山,“世界风筝都” 潍坊,国际啤酒城青岛,国际葡萄酒城烟台,荣城“天尽头”,“泉城”济南,黄河入海奇观,红色旅游景区沂蒙山等,都是旅游观光的好去处。自古以来,山东省众多名胜古迹就吸引了大量文人墨客流连忘返。改革开放之后,山东省的旅游业更是有了长足的发展和进步。众所周知,旅游业在人们的社会生活中的地位越来越重要,人们在闲暇生活中越来越多的选择外出度假旅游,这也极大地丰富了人们的生活,提高了生活的质量,而且带动了当地经济的蓬勃发展。虽然山东旅游业发展迅速,但仍旧存在着些许的不足之处,例如:山东省的旅游业的发展情况与其他旅游业发达的省市相比水平上还存在一定的差距,山东省旅游业发展水平与人们收入水平的提高速度以及日益增长的物质文化水平不相适应等。旅游业被称为无烟产业和朝阳产业,旅游业迅猛的发展使它在国民经济中的地位和作用越来越大。因此,研究山东省旅游业发展现状、趋势及对未来的预测,改善旅游业不足之处,对促进山东省国民经济的增长有十分重要的意义。

关键词:山东省旅游业 时间序列分析 发展现状 趋势 预测 AR模型

一、问题提出

近年来,山东省旅游各部门深入贯彻落实科学发展观,积极应对金融危机,群策群力,积极作为,调整旅游发展战略,通过一系列具有全局性、针对性、有效性的措施,千方百计拉动内需、扩大旅游消费、优化产业结构,全力打造“好客山东”文化旅游品牌,旅游业实现了又好又快的发展,并为促进山东全省国民经济平稳较快发展做出了突出贡献。我省旅游业与其他一些旅游大省相比仍就比较落后,存在一些不足之处,旅游业的发展无法满足人们的收入水平的增长以及消费理念的转变所产生的旅游需求,旅游的硬件设施仍旧落后,旅游安全方面的管理也不够完善。因此,此课题的研究是应用时间序列分析建立模型,针对未来几年的山东入境旅游人数做出预测,相关旅游单位可以根据此次预测加大旅游业的建设工作,增加相应资金的投入,建立健全相应设施,培训相关人员,加强旅行社的管理监督工作等,使之更好的接纳更多的来山东旅游的人,让他们切切实实感受到“好客山东”的文化旅游品牌的优越性。相信旅游业的迅猛发展,必将促进山东省国民经济更快更好的增长。

二、研究对象及背景介绍

旅游业是一种凭借旅游资源和设施,专门或者主要从事招徕、接待游客、为其提供交通、游览、住宿、餐饮、购物、文娱等六个环节的综合性行业。旅游集中体现了人们对生活质量各个方面的要求,旅游消费成为持续性的需求,这就使旅游业具有比较强的持续发展能力和抗风险能力。旅游发展不是简单地适应需求,而是满足现实需求、引发潜在需求和创造新的需求的综合体现。旅游业发展的潜力巨大、前景广阔,而且

2

仍将保持持续较快发展。现在我省的旅游业展开了多元化发展的趋势,保持市场持续增长,并且现在的旅游产品需求量越来越大,有更多的国内外游客来我省旅游。这使旅游效益不断显现。在新的发展阶段,我国旅游业处于发展的关键期,面临着优化产业结构、转变增长方式、提升发展质量和水平的艰巨任务。

本文的研究主要针对1990-2009年我省入境旅游人数,对旅游现状进行分析,建立时间序列模型,并对未来几年的我省旅游入境人数进行预测。研究我省旅游入境人数,针对未来的发展问题,对旅游业进行相应的改革和完善,使旅游业蓬勃发展起来,更好地促进我省国民经济的发展。

三、模型的选取

本文此次建立模型,选取时间序列分析预测的方法,选取山东省旅游入境人数的20个有序观察值,一步步进行分析和建模。时间序列是将某种统计指标的数值,按时间先后顺序排到所形成的数列,即为山东省1990年至2009年入境旅游人数。时间序列预测法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平,并且同时可以看出此阶段的现状和趋势。我们可以通过此次的模型建立,分析出山东省入境旅游的现状,趋势以及预测其未来的发展状况。

四、时间序列模型原理介绍

时间序列是指同一空间、不同时间某一现象的统计指标数值按时间先后顺序形成的一组动态序列。时间序列预测方法则是通过时间序列的历史数据揭示现象时间变化的规律,将这种规律延伸到未来,从而对该现象的未来作出预测。时间序列分析方法主要包括描述性时序分析和统计时序分析。早期的时序分析通常都是通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就是描述性时序分析。但随着研究领域的不断拓广,人们发现单纯的描述性时序分析有很大的局限性。在金融、保险、法律、人口、心理学等社会科学研究领域,随机变量的发展通常会呈现出非常强的随机性,想通过对序列简单的观察和描述,总结出随机变量发展变化的规律,并准确预测出它们将来的走势通常是非常困难的。

纵观时间序列分析方法的发展历史可以将时间序列分析方法分为两大类:频域分析方法和时域分析方法。时域分析方法主要是从序列自相关的角度揭示时间序列的发展规律。时域分析方法的产生最早追溯到自回归模型(AR模型)、移动平均模型(MA模型)和自回归移动平均模型(ARMA模型)的产生。时域分析方法的基本思想是时间的发展通常具有一定的惯性,这种惯性用统计的语言来描述就是序列值之间存在着一定的相关关系,而这种相关关系有着某一种统计的规律。我们分析的重点就是寻找着一种规律,并拟合出适当的数学模型来描述这种规律,进而利用这种规律来预测序列未来的走势。通常遵循以下步骤: 第一步:考察观察值序列的特征。

第二步:根据序列的特征选择恰当的拟合模型。 第三步:根据序列的观察值数据确定模型的口径。 第四步:检验模型,优化模型。

第五步:利用拟合好的模型来推断序列其他的统计性质或预测序列将来的发展。

自回归模型被称为经典时间序列分析方法,是时序分析方法的核心内容。它主要运用单变量、同方差场合的线性模型。随着人们对各个领域的研究深入,发现该经典模型在理论和应用上都还存在着许多局限性。统计学家纷纷转向了多变量场合、异方差场合和非线性场合的时间序列的分析方法的研究。在异方差场合,提出了自回归条件异方差(ARCH模型)。继而进一步放宽模型约束条件,提出了广义自回归条件异方差模型(GARCH模型)。

3

随后又有人提出了指数广义自回归条件异方差模型(EGARCH模型)、方差无穷广义自回归条件异方差模型(IGARCH模型)和依均值广义自回归条件异方差模型(GARCH-M模型)等条件更为宽松的异方差模型。这些异方差模型是对经典的ARCH模型很好的补充。后来研究的多变量场合,将随机事件的横向研究和纵向研究有机的结合在一起,提高了对时间分析和预测的精度。

传统的时间序列分析方法在经济中的应用,主要是确定性的时间序列分析方法,包括指数平滑法、移动平均法、时间序列的分解等等。随着社会的发展,许多不确定性因素在经济生活中的影响越来越大,必须引起人们的重视。1970年,Box 和Jenkins提出了随机理论为基础的时间序列分析方法,使时间序列分析理论上升到一个新的高度,预测的精度大大提高。

4.1 随机时间序列分析模型的三种类型:自回归模型(Auto-regressive model, AR)、移动平均模型(Moving Average model, MA)和自回归移动平均模型(Auto-regressive Moving Average model, ARMA)。

4.1.1自回归模型

如果一个随机过程可表达为 :Xt1Xt12Xt2pXtpt

其中i,i=1,2,„,p是自回归参数,t是白噪声过程,则称Xt为p阶自回归过程,用AR(p)表示。Xt是由它的p个滞后变量的加权和以及t相加而成。

2p(1-1B-2B--pB)Xt=(B)Xt=t。其中若用延迟算子表示:

(B)=1-1B-2B--pB2p称为特征多项式或自回归算子。

与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p),如果其特征方

2p程:(B)=1-1B-2B--pB=(1G1B)(1G2B)(1-GpB)=0的所有根的绝对值都大于

1,则AR(p)是一个平稳的随机过程。AR(p)过程中最常用的是AR(1)、 AR(2)过程。

Xt1Xt1t保持其平稳性的条件是特征方程1-1B=0的根的绝对值必须大于1,

满足|

11|>1,也就是:|1|<1。

4.1.2移动平均模型

如果一个线性随机过程可用下式表示:

Xtt-1t1-2t2--qtq(1-1B-2B--qB)t=(B)t。其中,1,2q2q是回归参数,t是白噪声过程,则上式称为q阶移动平均过程,记为MA(q)。之所以称“移动平均”,是因为Xt是由q+1个t和t滞后项的加权和构造而成。“移动”指t的变化,“平均”指加权和。

注意:(1)由定义知任何一个q阶移动平均过程都是由q+1个白噪声变量加权和组成,所以任何一个移动平均过程都是平稳的。(2)与移动平均过程相联系的一个主要概念是可

4

2q逆性。移动平均过程具有可逆性的条件是特征方程(B)=(1-1B-2B--qB)=0的全

部根的绝对值必须大于1.

4.1.3自回归移动平均模型

由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均部分的最大阶数。ARMA(p,q)的一般表达式是:Xt1Xt12Xt2pXtpt-1t1-2t2--qtq

2p2q即 (1-1B-2B--pB)Xt=(1-1B-2B--qB)t

或(B)Xt=(B)t。其中(B)和(B)分别表示B的p,q阶特征多项式。 4.2残差自回归模型

Auto-regressive模型的构造思想是首先通过确定性因素分解方法提取序列中主要的确定性信息:XtTtStt 式中,Tt为趋势效应拟合,St为季节效应拟合。

考虑到因素分解方法对确定性信息的提取可能不够充分,因而需要进一步检验残差序列{t}的自相关性。如果检验结果显示残差序列自相关性不显著,说明确定性回归模型对信息的提取比较充分,可以停止分析了。如果检验结果显示残差序列自相关性显著,说明确定性回归模型对信息的提取不充分,这是可以考虑对残差序列拟合资回归模型,进一步提取相关信息:t=1t12t2ttpat。

这样来构造的模型:

XtTtStt,

t=1t12t2ttpat,

E(at)=0,Var(at)=2,Cov(at,ati)=0 i1称为(残差)自回归模型。 实践中,对趋势效应的拟合常用如下两种方式: (1)自变量为时间t的幂函数:Tt=01tktkt。

(2)自变量为历史观察值{Xt1,Xt2,,Xtk},Tt=01Xt1kXt-kt。

六、基于时间序列模型的入境旅游人数预测实例分析

入境旅游人数受天气、旅游设施建设、一国宏观、百姓的消费水平、旅游景点的发展方针等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的因果模型分析和预测入境旅游人数往往比较困难。将历年的入境人数作为时间序列,根据过去的数据得出其变化规律,建立预测模型,用此来预测未来的发展变化,有着重要的意义。

我们选取了山东省1990年到2009年共20年间入境旅游人数的数据,用时间序列分析方法对此进行分析,并通过预测2008年和2009年两年的入境人数和真实值进行比较,选取最合适的预测模型来预测2010年和2011年入境旅游人数。

5

表1 山东省旅游入境人数表 单位:万人 年份 1990 1991 1992 1993 1994 1995 1996 人数 年份 人数 年份 人数

12.47 1997 58.5 2004 119.31

17.2 1998 60.82 2005 155.11

24.13 1999 62.2 2006 193.13

28.43 2000 72.31 2007 249.

34.94 2001 82.87 2008 253.67

45.09 2002 97.68 2009 310.04

53.16 2003 77.67

对于一个给定的时间序列,在没有任何信息的情况下,要对时间序列进行建模并且进行预测,首先我们应该先划出时间序列的时序图,看它是否是平稳的。下面的SAS软件(Statistical Analysis System)就是在画入境旅游者人数的时序图,看其具有怎样的趋势。我们绘制了这20个数据的折线图,从图上可以看出该时间序列是非平稳的,它有一种长期上升的趋势,是非线性的。如图1

图1 1990年到2009年入境人数的时序图

由有时序图猜测:入境旅游人数呈逐年递增趋势,并且增长的速度越来越快。于是本文做出了一条平滑递增的曲线来拟合这种趋势,如图1-2:

6

图2 时间序列的实际值与拟合图

从图1-2可以看出,这条曲线能够较好地拟合这些点。

接下来是利用SAS程序对时间序列建立非线性模型的输出结果:

表2

由表2的的结果可知,所建立的非线性模型的显著性检验通过,因为p<0.0001由表3的输出结果可知,所得到的拟合模型为:xt5.0432t1.3086tt。用该模

型预测2008年山东省旅游入境人数为xt15.0432191.3086年山东省的旅游入境人数为xt25.0432201.30862019261.52(万人次),2009

317.70(万人次)。用该模型预测

212010年山东省旅游入境人数为xt15.0432211.3086东省的旅游入境人数为xt25.0432221.3086223.66(万人次),2011年山

2012年,

482.27(万人次)。 同理得到

2013年,2014年,2015年的山东省旅游入境人数为487.316,756.901,958.17,1200.00 。

7

在画出的拟合值与实际值的拟合效果图中可以看出拟合效果是很好的,但是明显发2003年的实际值低于预测值,这在实际中也是可以解释的,由于2003年突如其来的SARS的冲击,使得人们不敢外出,导致旅游业呈现出大幅的下滑趋势。用时间序列的预测方式对时间序列进行预测,只能大体的反应时间序列的基本走势,它不能预测到外界环境的冲击对时间序列的影响。

上面对时间序列直接建立非线性模型,虽然能直观的反映出时间序列的基本走势,但是有时候这种直接提取确定性信息并不能保证所提出的信息已经很充分了,这时候我们应该对时间序列建立ARIMA模型,它能比较充分的提取出确定性信息。

由时间序列的时序图可以看出,该时间序列是非平稳的,它存在一个长期的增长趋势,我们可以对时间序列进行差分,下图是对时间序列进行一阶差分后的时间序列图,可以认为一阶差分时间序列是平稳的,大约在十附近来回波动。所以对一阶差分后的模型建立ARMA模型。一阶差分后的时序图:如图3.

图3 一阶差分后的时序图

(1)画出一阶差分后的时间序列的自相关图和谝自相关图。

图4 自相关图

8

图4 偏自相关图 表4

由3、图4的自相关图和偏自相关图可以看出,差分后的时间序列的自相关图是拖尾的,偏自相关图是截尾的,但是有时候对模型的截尾性存在一定的主观性,并不能确定阶数。对差分后的模型 进行白噪声检验由图1-8可知,p>α=0.05,所以不能拒绝原假设,认为差分后的模型是一个白噪声序列,所以应该对原时间序列建立ARIMA(0,1,0)模型,

xtxt1t,这是一个随机游走模型,即所谓的醉汉模型,这时所建立的模型对预测是没

有效果的,该模型的建立是没有意义的。

为了克服提取确定性信息时所带来的提取的信息不充分的缺点,现在我们先对时间序列提取确定性信息,然后在对所建立的模型中的残差进行自回归拟合。下面就是建立这个模型。

表5

9

由表5上面的输出结果可知,DW统计量的值等于0.2825,p<0.0001<α=0.05,所以所建立的残差序列显著负相关,所以应该考虑对该残差序列拟合自相关模型。 1. 普通最小二乘估计结果 表6

表6

10

表6、7的输出信息包括误差平方和(SSE),自由度(DFE),均方误(MSE),根号均方误差(Root MSE),SBC信息。AIC信息,回归部分相关系数平方(Regress R-Square),总的相关系数平方(Totel R-Square),DW统计量(Durbin Watson)及所有待估参数的自由度,估计值,标准差,t值和t统计量的p值。 2.回归误差分析

该部分共输出四方面的信息;残差序列自相关图,逐步回归消除的不显著项报告,初步均方误差(MSE),自回归参数估计值。该部分的输出结果如下图所示: 表8

表9

由表8、9可知:在该模型中输出的残差序列的自相关图显示残差序列有显著的一阶正自相关。逐步回归向后消除报告显示出了1阶的序列值显著自相关外延迟其他阶数的序列值均不具有自相关性,因此延迟2阶-5阶的自相关项被消除,初步的均方误差为675.9,1阶残差自回归模型的参数ˆ1=-0.6934,这里意味着输出的自回归模型结果为:

ut0.6934ut1t

3.最终拟合模型

该部分输出三方面的汇总信息:收敛状况,极大似然估计结果和回归系数估计,该部分所输出的结果为 表10

11

由表10可得,该时间序列得到的最终拟合模型为:

i.i.dxt15.2618tut,t~N(0,427.855) ut0.9001ut1t上面的模型并不能直观的得到拟合结果,下面将利用output命令画出拟合的模型。

图5

用所建立的模型预测2010年山东入境旅游者人数为320.4978,2011年山东省入境旅游者人数为335.7596,,同理得到2012年,2013年,2014年,2015年的山东省入境人数分别是425.16,437.27,457.38,508.12.该模型的预测值都小于上面用非线性拟合所建立的模型,由拟合值与实际值之间的关系可知第二个模型的拟合值优于第一个值,说明运用非线性的模型直接提取确定性信息时所提出的信息不充分,有一部分一留在了残差部分。运用非线性拟合所做的模型中只考虑了近年来的发展趋势,但是旅游入境人数也和人口,人民的财富水平有关,在非线性模型的拟合中这些因素的变化没有考虑到,都遗留在残差中,而所建立的残差自回归模型则考虑了遗留在残差中的信息,故所建立的模型要优于非线性所拟合的模型。

虽然已完成了上面模型的建模,但但是我们没有考虑到如果模型的残差部分存在异方差对模型所带来的影响,这是我们应该检验所建立的模型中是否存在异方差。 表11

12

表11是异方差的检验结果,所建立的模型中不存在异方差,故所建立的残差子回归模型中残差不存在异方差,因为p值都大于α=0.05。所以所建立的模型即是最终的模型。即为:

七、结论

旅游业绿色环保、能源消耗少,是第三产业的重要组成部分,是世界上发展最快的新兴产业之一,被誉为“朝阳产业”。近年来山东省大力发展旅游业,吸引了众多海内外人士前来观光旅游,入境旅游人数的持续增长,带动了山东省相关产业的蓬勃发展。但与此同时,也暴露了山东省旅游业发展中一些不容忽视的弊端。对此,我们提出了一些建议,供有关部门参考。

1、针对旅游方式的单一化的缺点,本文建议大力扩展我省的旅游产品结构,使旅游产品多样化;深入挖掘文化内涵,大力发展旅游文化产品;突出主题,不断创新,大力开发专项旅游产品。

2、针对旅游基础设施薄弱的缺点,本文建议加强国内旅游业基础设施和服务设施建设。相关部门要借助当前扩大内需,增加投资的机会,筹集更多资金投入到基础设施建设中去;加强交通投资,解决瓶颈制约;做好旅游市场的信息预测、宣传广告及可行性研究的分析工作;加强对旅游业的理论研究。

3、充分利用经济、法律、行政手段,加强旅游市场的宏观。以经济为手段,以价格杠杆为基础,制定符合旅游业正常经营范围的价格内容;利用法律手段,健全相关法律,维护旅游者的正当权益;利用行政手段,制定相关产业,指导旅游业协调适度发展。

参考文献

[1]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2008

[2]高惠璇,李东风,耿直,栾世武,张平.SAS系统与基础统计分析[M].北京:北京大学出版社,1995

[3]邓祖新.数据分析方法和SAS系统[M].上海:上海财经大学出版社,2006

[4] 钟安石,王翠. 山东省旅游业发展现状分析及对策研究[J].科技与管理,2010(01):0020-04.

[5] 赵婷. ARMA在我国GDP预测中的应用[J].金融领域,2011(01):1004

[6]曹友情,吴优,费黎娅. 我国旅游业发展现状及对策 [J].湖南农机,2010(07):43007 [7]唐兰兰,洛高远. 旅游业发展现状及制约因素 [J].内江科技,2009(01):23009

13

[8]吴宝华,叶嘉伟. 时间序列模型在珠海游艇旅游收入预测中的应用 [J].航海工程,2009(12):510

[9]刘佳,赵慧文,刘光荣. 基于SAS的非平稳时间序列分析及实证研究 [J].汕头大学学报,2010(02):710051

[10]肖莉. SAS统计软件在《时间序列分析》课程中辅助教学的探讨[J].科技创新导报,2011(02):5102

[11]肖枝洪,郭明月. 时间序列分析与SAS应用[M].武汉:武汉大学出版社,2009

14

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务