多模型拟合与组合预测

来源：意榕旅游网

多模型拟合与组合预测

对时间序列建模好比替人物画速写；简单几笔素描突出人的特点并由此推测人物个性。时间序列模型也能模拟数据特征、提炼数据信息、预测数据规律。然而，正如每张素描仅能反映人物某一侧面，多个角度的素描才能完整逼真人物形象，非线性复杂时间序列的数学模型仅是该序列的某种简化和抽

象，其所包含

的变量和参数必定是有所选择并十分有限的。不同模型对同一序列的描述往往各有特点、各有适用场合、也各有不足之处。理论和实践表明，多模型的拟合与组合预测能提高模拟的功效和预测的精度。

事实上，在预测实践中，对于同个问题，我们常采用不同的预测方法。不同的预测方法其预测精度往往也不相同。一般是以预测误差平方和作为评价预测方法优劣的标准，从各种预测方法中选取预测误差平方和最小的预测方法。不同的预测方法往往能提供不同的有用信息，如果简单地将预测误差平方和较大的方法舍弃，将推动一些有用的信息。科学的作法是将不同的预测方法进行适当组合，形成组合预测方法。其目的是综合利用各种预测方法所提供的信息，以提高预测精度。

早在19年，美国人Schmitt曾经采用组合预测方法对美国37个最大城市的人口进行预测使预测精度提高。1959年，J.M.Bate t C。W。J。G拒有对组合预测方法进行比较系统的研究，研究成果引起预测学者的重视。此后，国外关于组合预测的研究成果层出不究，我国近十几年也很重视组合预测的研究，取得一系列研究成果。

采用组合预测的关键是确定单个预测方法的加权系数。设对于同一个问题有

(n2)种预测方法。给出如下记号：yt为实际观察值；fit为第i种方法的预测值；

eitytfit为第i种方法的预测误差；ki为第i种方法的加权系数，

ki1nietytft为组合预测方法的预测1;ftkifit为组合预测方法的预测值；

i1n误差，于是etytftkifit。其中，i1,2,,n;t1,2,,N。

i1n记组合预测方法的预测误差平方和Jet2，则

i1NJi1nj1nNkk(ee)ijitjt

t1记组合预测方法的预测加权系数向量为Kn[k1,k2,,kn]T，第i种预测方法的预测误差向量为Ei[ei1,ei2,,eiN]T，预测误差矩阵为e[E1,E2, ,En]，于是

TJeTeKnE(n)Kn

中

E11E21En1TiNE12E22En2E(n)E1nE2n Enn2而EijEjiEEj,EiiEEiait。Eii为第i种预测方法的预测误差平方

Tit1和。E(n)反映了各种预测方法提供的预测误差信息，称为预测误差信息矩阵。

记Rn[1,1,,1]Tn1T，则国中权系数的约束条件ki1改为RnKn1。于是组

i1n合预测问题可表示成非线性规划模型（11.1）

TminJKnE(n)Kn

（11-1a）

TRnKn1s.t. K0n

(111b)

(111c)11.1 综合模拟和预测的基本思想

自从60年代末模型综合研究开创以来，在经济预测和决策及证券投资等方面得到了有效的应用，但是在统计预测研究和应用方面目前尚属初级阶段。由前几章的讨论可见，不同的预测模型预测精度往往有差异。怎样对这些模型的预测结果进行客观的综合应用，一直是人们在探讨的一个问题，眼下大多是人为定性综合。本章提供一种科学的组合预测方法对模型进行定量综合，以期提高预测结果的可靠性和客观性。

设{Xt},t1,2,,N为某个统计量的观测序列，ˆt(j)},j1,2,,J,t1,2,,N，为对应的用J个预测模型得到的拟合序列。对{xˆNk(j),j1,2,,J，将这JxN,k,k1,2,,K用J个不同模型获得的预测值记为xˆNk的组合预测值记为xˆNk，则通常有以下两类综合模式：个模型对x11.1.1 权重综合

ˆNkWjxˆNk(j),k1,2,,K xj1J （11-2）

式中Wj,j1,2,,J为第j个模型在综合预测值中所占的权重，一般情况下为了保持综合模型的无偏性，Wj应满足归一化约束条件

Wj1Jj1 （11-3）

构成Wj的方法有多种，常用的有算术平均法、均方倒数法、方差倒数法、二项式系数法、简单加权法和最优加权法等，将在下面加以介绍。 11.1.2 区域综合

ˆNl(j)Nl(j)),j1,2,,J，则xˆNl的置信区间设J种预测值有置信区间(x是这J个区间的交集

ˆNlNl)(xˆNl(j)Nl(j)) (xj1J （11-4）

如果上式为空集，则依次排除该时刻最大和最小预测值的置信区间，若剩余模型超过半数则仍由上式进行区域综合，否则需要新建模预测。若有模型无法估计置信区间，则将其排除后也按上法处理。

11.2 最优加权法

在研究和应用中我们通常较多地采用权重综合的方法，在确定各个模型的权重时，首先想到的是在某一意义上求得最优权重向量，因此下面先讨论最优加权法。

最优加权法的基本原理是依据某种最优准则构造目标函数Q，在约束条件（记为s.t.）下极小化Q求得综合模型的加权系数，这些权重系数就是各个模型的最优权。

11.2.1 最优加权模型

设{xt},t1,2,,N为观测序列，有J个预测模型对之进行预测，拟合值记为

ˆt(j)},j1,2,,J,t1,2,,N，则最优加权模型的组合权重系数{xWj,j1,2,,J，是以下规划问题的解：

minQQ0(w1,w2,,wJ) )s.t.( （11-5）

式中Q为目标函数，s. t. 为该规划问题的约束条件。在有些实际问题中还要求wj非负，即。

j1Jwj1,wj0,j1,2,,J

（11-6）

目标函数Q 的形式由误差统计量及极小化准则的类型确定，常用的误差统计量有以下几种： ① 拟合误差et

ˆtxtwjxˆt(j)etxtxj1Jˆt(j))wjet(j)wj(xjxj1j1JJ （11-7）

et/xt，

③ 对数误差 et,t1,2,,N

ˆt etlogxtlogx极小极大化准则，分别构成如下形式的目标函数：

① Q(et*)2

j1J② 相对误差

（11-8）

（11-9）

目标函数极小化准则也有多种，最常用的有最小二乘准则、最小一乘准则和

（11-10）（11-11）（11-12）

② Q|et*|

t1N

③ Qmaxet*

1tN

式中误差统计量可从（11-7）—（11-9）式中选取。以上准则有时还考虑（对时间t）加权的情形。

选取第一种目标函数，以拟合误差为统计量，采用常用的最小二乘准则，则可以获得最优权系数的解析解。

11.2.2 最小二乘准则下综合模型最优权系数

我们选取拟合误差et为误差统计量，此时的规划模型为

N2minQQett1 Js.t.wj1j1 （11-13）

为求解wj,j1,2,,J，将上式表示为矩阵形式，令

W(w1,w2,,wj),R(1,1,,1)

ej(e1(j),e2(j),,eN(j))e(e1,e2,,eN),j1,2,Jeijeiejet(i)et(j),t1NE(eij)JJ

（11-14）

JJ矩阵E对称正定，称为信息阵，由上式得：

ˆtwjet(j)(et(1),et(2),etxtx,et(J))W

j1J （11-15）

e1e1(1)e1(J)eW(e1,e2,,eJ)W

eNeN(1)eN(J)（11-13）式的矩阵形式可表示为：

minQQeeWEW RW1S.t. （11-16）

（11-17）

引入Lagrange剩子λ，使Q取极小值的必要条件为：

d(WEW2(RW1)0 dW即

EWR0,WE1R

又由得

d(WEW2(RW1))0 dRW1即R(E1R)1

可解得Lagrange乘子，(RE1R)1 从而得最优权，W0和最小Q值Q0

111W0(RER)ER 11Q0(RER)Q0即为最优综合模型的误差平方和。为保证E1存在，要求J个模型的误差向量ej线性无关。

11.2.3 最小二乘准则下最优综合模型的精度分析

关于最小二乘法得到的最优综合模型的精度以及最小的目标函数Q0有以下几个主要结论：

结论1：最小二乘法可以求得误差平方和最小的综合预测模型，因而它是最优

的，其精度优于其中任何一个单一模型和综合模型。

记Q0,W0对应于最优综合模型；Q，W对应任一综合模型；Q(j),W(j)对应参加综合的第j个模型，由于目标函数Q是模型精度的保证，Q0是Q的极小值，因此有QQ0，又有W(j)(0,,0,1,0,,0)，由最优解的唯一性知，除非W(j)W0，否则必有QQ0，因此可以得出上面的结论。

结论2：记min和max分别为对称正定矩阵的最小和最大特征，则最优综合模型的误差平方和Q0满足：[2]

min/JQ0max/J

（11-18）

上式中J为参加综合的模型个数，该不等式表明，J越大，Q0的变化范围越小，Q0绝不可能减小到min/J以下，也不可能超过max/J。

结论3：Q0trE/J,trEejj，其中trE为矩阵E的迹

j1JJ由矩阵迹的定义知，trEejjj,1,,J为E阵的非负特征根。可

j1j1J得

Q0max/J(j)/JtrE/J

j1J （11-19）

结论4：当参加综合的模型个数由J种增加到J+1种时，最优综合模型的预测误差平方和满足不等式[3]

QJ1QJ

上式等号成立的充分必要条件为

（11-20）

WJQJ,(e1,J1,e2,J1,,eJ,J1)

（11-21）

11.3 模型综合的正权组合方法

最小二乘准则下得到的最优权重可能出现负值，这往往与实际要求不符。因此常在约束条件中增加正权重约束以得以次优的正权重组合。本节对一些常用正权组合类型进行讨论与比较，并给出提高预测精度的方法。 11.3.1 正权组合类型

1．算术平均法

wj1,j1,2,,J J （11-22）

该法又叫作是等权平均法。算术平均法的特点是对各模型同等看待，并赋予相同的权重，通常在对各模型重要性缺乏了解时常用。这种方法计算简单，且其

加权系数自动满足非负条件，因此在目前各个领域的研究和应用中它用的比较多，也是目前讨论较多的组合预测方法之一。

2．方差倒数法

1wjD/Dj,j1,2,,J

1jj1J （11-23）

式中Dj为第j个模型的误差平方和，该法对误差平方和小的模型赋以高权重。

ˆt(j))2 Dj(xtxj1N （11-24）

这种方法及下面的几种方法与算术平均法不同，它要求对各模型有一定的了解。

3．均方倒数法

1/2/D,j1,2,,J jj1JwjD1/2j （11-25）

式中Dj定义如（11-26）式。 4．简单加权法

wjj/j2j/(J(J1)),j1,2,,J

j1J （11-26）

式中J个模型按误差平方和Dj降序排列，其基本思想也是对误差平方和小的模型赋以高权重。

5．二项式系数法

1J1wjCJj,j1,2,,J 1/2式中Cj1J11LˆNl(j)增序排列，上式的权重为二项式系数，该法要求模型按xLl1使组合预测向排序居中的预测值靠近。下面是一种改进的二项式系数法权重能保证高精度模型的选取：

12(J1)wjC2jJ,j1,2,,J 1/2 （11-27）

此处模型按误差平方和{Dj}降序排列，该权重与{Dj}反序，由下式可以证明

jJ112J12J1j12J1wj1：1()C2J1()

222j0在以下有关二项式系数权重的讨论中采用的都是改进的二项式系数权重。

11.3.2 正权综合模型误差平方和的上下界

由信息阵E中元素eij的定义知，当ij时，eij为第j个模型的误差平方和。正权综合模型的误差平方和Q满足下面的不等式：

min/JQ0Qwjejjmax{ejj}

j11jJJ （11-28）

上式的左半部分在上一节的讨论中已经证明，下面我们证明右半部分。由正权性和Shwarz不等式：

QWEWi1Jj1Jwiwjeiji1Jj1Jwiwjeiej2i1JJj1JwiwjJJJeiiejjwiejjj1j1Jwjwjejj

2wjwjejjwjejjj1j1j1max{ejj}1jJ由不等式（11-28）可知正权综合模型具有下面共同的特性： ① 正权综合模型的误差平方和有共同的上下界 ② 正权综合模型可能是次优的(QQ0)

③ 正权综合模型优于精度最差的单个模型(Qmaxejj)

J④ 任一组合预测方法的误差平方和不大于各个单项预测模型的预测误差平方和的加权平均（该加权平均的加权系数就是该组合预测方法的加权系数）。 11.3.3 常用正权综合方法的精度比较

一、算术平均法记则

WA11(1,1,,1)R JJ

（11-29）

（11-30）

11JQAWAEWA2RERejjUA

Jj1J上式中QA为算术平均组合方法的误差平方和，UA记为QA的上界。很明显，UA是各个单项预测模型预测误差平方和的加权平均。由（11-28）和（11-30）知，算术平均法的预测误差平方和小于各个单项预测模型预测误差平方和的最大者但不能保证小于其最小者。

关于算术平均法的几个结论：

1．设Qminmin{ejj}表示单项预测模型预测误差平方和的最小值，则QAQminj的充要条件为i1Jj1Jeijn2Qmin[25]。

2．如果信息阵E的主对角线元素相同，即e11e22eJJC,C为某一常数，则必有QAC。

证明：

因为信息阵E为正定矩阵，由矩阵理论知E的任意一个二阶主子式为正，既有

CeijeijC2C2eij0，从而有|eij|C。

1QA2Jj1j1JJ1eij2Ji1j1JJ1|eij|2JCC

i1j1JJ上式即为QAC，由此可见组合预测方法的优越性。

结论b表明，尽管各种预测模型的预测误差平方和相同，但通过算术平均法必定可以使组合预测方法的预测误差平方和减少。

3．算术平均模型为最优的充分必要条件为

j1Jeijhih,i1,2,,J

此式成立时，QAQ0二、均方倒数加权法记则

h，且h为矩阵E的特征根。此结论的证明见文献[2]。 JWB(j1J11111ee22,,eJJ) jj)(e11,QBWBEWBWjejj(e/1jjj1j1j1JJJ1ejj)ejjj1Jejj/j1J （11-31）

1ejjUBUB为QB的上界。

UBUAj1Jejj/i1Je1jj那么

1JejjJj1Ji1JejjJJj1J

1ejjejjj1由Shwarz不等式

J(2j1121jj)jj,j0,j

1,2,,J令jejj，代表不等式得

UBUAj1Ji1JJejjJJ2j1Jejj(j1JJJejjj11ejjJ1ejj)

Jejjj11ejjJJejjj1j1(j1Jejj)2Jejjj1J1 （11-32）

Jejjj1Jejjj1上式（UBUA）表明均方倒数加权模型的误差平方和上界小于算术平均综合模型，前者精度比后者高。

对于任意给定的J种预测方法，我们有QAUA,QBUB，但是UBUA尽管我们不能保证一定有QBQA，但是作为一种加权原则，可能取加权系数向量WB比取WA更好，因为前者导出的组合预测方法的预测误差平方和有较小的上界。以下类似的情况与上述讨论相同。

三、方差倒数加权法记则

11111Wc(ejj)(e11,e22,,eJJ)

J1J

（11-33）

（11-34）

1QcWcEWcWjejjJ/ejjUc

JJj1j1由Shwarz不等式可得：

UCUBjj1JeJ1jj(j1JJe)1jj21JejjJj1Jj1J1 （11-35）

1ejjj1ejj1Jejjj11Jejjj1由此可得UCUBUA，也就是说均方倒数综合模型的精度比算数平均综合模型的精度高，方差倒数综合模型精度又比前两种模型都高。

四、简单加权法（要求误差平方和按降序排列）记则

WD2(1,2,,J)

J(J1)J （11-36）（11-37）

QDWDEWDj1J2WjejjjejjUD

J(J1)j1可以证明

UDUA[14]

五、二项系数法（要求误差平方和按降序排列）记则

01J1WE22(J1)(C2J1,C2J1,,C2J1)

JJQEWEEWEWjejj2j12(J1)Cj1j12J1jjeUE

可以证明

UEUDUA[24]

由常用的五种正权综合方法（分别记为A、B、C、D、E）的精度比较可以看出，后面4种方法所得到的综合模型的精度都比算述平均模型高，但是，算术平均法用的最多。为提高综合预测的精度，研究其它正权综合方法也很有必要。

11.4 正权综合方法的改进——递归下权综合方法

运用递归技巧，能进一步提高正权综合模型的预测精度，实现递归技巧的步骤如下：

① 用J个初始模型拟合|Xt|,t1,2,,N，计算各模型的误差平方和

ˆt(j))2,j1,2,,J。 ejj(xtxt1N② 将J个模型的误差平均和按降序排列，记为e(1)e(2)e(J)，则

e(1)max{ejj},e(J)min{ejj}。

1jJ1jJ③ 给定迭代精度，如果e(1)e(J)，则终止迭代。模型（J）相应于初始模型的权系数即为所求，否则作下一步。

④ 计算以上J个模型的某种正权综合（记为方案（*））及其误差平方和e(*)，记录方案（*）关于初始模型的权系数向量W(*)，由（11-28）式知，必有e(*)e(1)，用e(*)取代e(1)，方案（*）取代方案（1），回到步骤（2）重新作下轮迭代。

迭代精度的大小可根据实际需要和计算能力来决定（例如0.001），本递归对任何一种正权方法都适用，这是由于（11-28）式保证了每轮递归中误差平方和必有不等式0e(*)e(1)，递归程序必定收敛，且精度优于非递归情形。因此递归正权综合决策可以进一步提高综合模型的可靠性。

11.5 结论

前面我们介绍了正权组合方法，讨论了最常用的5种正权综合模型的精度以及给出了正权综合模型的改进方法。通过理论上的证明以及实际数据的计算，我们得出了一个非常有价值的结论：即先对数据多建几个预测模型，再用算术平均进行综合，最后再通过递归迭代进行组合预测，这样建模不仅简单，而且预测精度也较高。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文