①测定预测精度的方法【误差】—②组合模型【线性组合模型+最优线性组合模型+贝叶斯组合模型】

文章目录

1 测定预测精度的方法

平均误差

$ME=\frac{\sum\limits_{i=1}^n{\left( y_i-\hat{y}_i \right)}}{n}$

平均绝对误差
$MAD=\frac{\sum\limits_{i=1}^n{\left| y_i-\hat{y}_i \right|}}{n}$
平均相对误差
$MPE=\frac{1}{n}\sum\limits_{i=1}^n{\frac{y_i-\hat{y}_i}{y_i}}$
平均相对误差绝对值
$MAPE=\frac{1}{n}\sum\limits_{i=1}^n{\left| \frac{y_i-\hat{y}_i}{y_i} \right|}$
预测误差的方差（均方误差）
均方误差MSE（Mean Squared Error）又被称为 L2范数损失。
$MSE=\frac{\sum\limits_{i=1}^n{e_i^2}}{n}=\frac{1}{n}\sum\limits_{i=1}^n{\text{(}y_i-\hat{y}_i}\text{)}^2$
预测误差的标准差（均方根误差，又叫标准误差）

$RMSE=\sqrt{\frac{\sum\limits_{i=1}^n{e_i^2}}{n}}=\sqrt{\frac{1}{n}\sum\limits_{i=1}^n{\text{(}y_i-\hat{y}_i}\text{)}^2}$

2 组合模型

组合预测就是设法把不同的预测模型组合起来，综合利用各种预测方法所提供的信息，以适当的加权平均形式得出组合预测模型。

虽然单项经济预测方法在经济预测中仍占据主导地位，但是各种单项预测模型都有自己的假设前提、特点和适用场合。

例如

经典线性回归模型要求变量之间线性关系显著，对于出现数据序列相关、异方差性、多重共线性等要进一步讨论。
灰色系统模型虽然要求的数据序列较短，但是用于GM(1,1)建模的原始序列 $X^0$

鉴于不同的单项预测模型利用的样本数据不尽相同，它们从不同的角度提供各个方面有用的信息，各有优点和缺点。

在得到多个独立预测模型的研究结果后，寻找既基于这些单项预测模型的结果，又能够博采众长，从而得到更好效果的组合预测模型。

单项预测模型

线性回归模型（以前记过的笔记）
灰色预测模型（以前记过的笔记）
时间序列模型（以前记过的笔记）
BP神经网络（以前记过的笔记）
参考文献中的GABP神经网络模型

2.1 模式一：线性组合模型

预测的关键是建立合理的预测模型。不同的预测模型各有长处，通过对不同预测模型的线性组合可以得到效果更好的线性组合预测模型。

形式如下：
$\hat{y}_t=\omega _1y_{1\left( t \right)}+\omega _2y_{2\left( t \right)}+...+\omega _my_{m\left( t \right)}$

式中， $i=1,2,\cdots ,m\text{ ；}t=1,2,\cdots ,n$

$\hat{y}_t$
$y_{i(t)}$
$y_{(t)}$
$e_{it}=y_{\left( t \right)}-y_{i\left( t \right)}$
$e_t=y_{\left( t \right)}-\hat{y}_t\ \text{，}t=1,2,\cdots ,n$
$W=\left( \omega _1,\omega _2,\cdots ,\omega _m \right) ^T$

线性组合预测模型的关键在于确定合理的权数 $\omega_i$

即

$SSE=\sum_{t=1}^n{e_{t}^{2}}=\sum_{t=1}^n{\left( \sum_{i=1}^m{\omega _ie_{it}} \right) ^2=W^TEW}$

即
$\left\{ \begin{array}{l} \min\text{\ }SSE=W^TEW\\ \\ s.t.\ R_mW=1\ \text{，}W\ge 0\\ \end{array} \right.$

$\Rightarrow W_0=\frac{E^{-1}R_{m}^{T}}{R_mE^{-1}R_{m}^{T}}$

其中 $R_m$

例如，在参考文献中，已经得到每个单项模型的预测值

信息误差矩阵

16.2487 = (51.4-50.1)(51.4-50.1)+(44.7-48.01)(44.7-48.01)+…

通过公式
$W_0=\frac{E^{-1}R_{m}^{T}}{R_mE^{-1}R_{m}^{T}}$

得到线性组合模型最优加权系数

$W_0=\left( 0.0323,0.4160,0.5517 \right) ^T$

可以得到组合模型预测值

如下表中组合模型第一个预测值

51.37 = 0.032350.1+0.416049.73+0.5517*52.69

通过比较模型的相对误差，可以判断模型的预测精度。

2.2 模式二：最优线性组合模型

原理：利用样本期的实际值和各单项预测模型的拟合值，进行线性回归，然后利用线性回归模型，以原方案的预测值作为外生变量进行外推预测。

最优线性组合模型的一般形式为：
$y_t=a+b_1y_{1t}+...+b_ny_{nt}$

$y_t$
$y_{1t},y_{2t},...,y_{nt}$

最优线性模型是广义的线性组合预测模型，其特点在于组合权数由线性回归得到。

2.3 模式三：贝叶斯组合模型

贝叶斯组合模型是线性组合模型的特例

在 n 种单项预测模型中选择一种为主要方案，由这一方案得出的预测值为原预测值。然后，取其他 n－1 种预测方案在某一时点上的预测值分布的均值和方差，代入下面公式，就得到贝叶斯组合模型。

$\hat{Y}_{t+1}=\left( Y_{t+1}/s_{_{y,\,t+1}}^{2}+\bar{Y}_{t+1}/s_{_{\bar{y},\,t+1}}^{2} \right) /\left( \frac{1}{s_{_{y,\,t+1}}^{2}}+\frac{1}{s_{_{\bar{y},\,t+1}}^{2}} \right)$

$\hat{Y}_{t+1}$
$Y_{t+1}$
$\bar{Y}_{t+1}$
$s_{_{\bar{y},\,t+1}}^{2}$
$s_{_{y,\,t+1}}^{2}$

参考文献：
《线性组合预测模型及其应用》
《统计预测与决策》