淘先锋技术网

首页 1 2 3 4 5 6 7

本文主要内容是使用LSTM网络进行不同类型的时间序列预测任务,不涉及代码,仅仅就不同类型的预测任务和数据划分进行说明。
参考文章:https://machinelearningmastery.com/how-to-develop-lstm-models-for-time-series-forecasting/

注:所涉及的概念在数据案例会说明

时间序列数据预测本质就是利用先前的值预测后面的值,在得到一组数据后,需要将数据处理为一个个样本,每个样本中包括先前的数据和要预测的数据,将其作为训练集

1 单变量时间序列数据预测

单变量时间序列数据指的是,除了时间属性数据,只有单一属性的一组数据,比如2010一年间黄金的价格,按天统计,也就是一天一个数据。数据中只有价格这一个属性,共365个数据。
同时单变量也是指数据只有一个序列,一个变量也就是一个特征(feature)。
在这里插入图片描述

1.1 单步预测

单步预测中的单步是指一个时间步长(time step),比如上述黄金价格数据中,每一天就是一个时间步长,即在时间序列数据中每获取一次数据就是一个时间步。

单步预测就是仅仅预测一个时间步长的数据。

单变量时间序列数据的单步预测(单变量单步预测,Univariate Step):利于前边几个时间步长的数据预测下一个时间步长的数据

数据处理:

数据集dateset
[10, 20, 30, 40, 50, 60, 70, 80, 90]

上面的少量数据中,只是单一属性的一组数据。在进行预测前要将数据处理为样本(假设使用3个时间步长的数据预测下一个时间步长的数据),样本结构如下:
以下数据共有6个样本,每个样本中都是前三个时间步长的数据为一组作为输入,下一个时间步长的数据为另一组作为输出。

[10 20 30] 40
[20 30 40] 50
[30 40 50] 60
[40 50 60] 70
[50 60 70] 80
[60 70 80] 90

即:
	输入			输出
[[10, 20, 30],		[40,
[20, 30, 40].		50,
……			]			]

使用这样的数据训练一个模型后,我们就可以使用前连续三个时间步长的数据预测下一个时间步长的数据。

最后我们在看一下样本中输入数据和输出数据的维度:
输入:两个维度,样本总数、用于预测的时间步长,这里分别是6、3
输出:一个维度,样本数量,这里是6

1.2 多步预测

单变量时间序列数据的多步预测(单变量多步预测,Univariate Multi-Step):利于前边几个时间步长的数据预测下面多个时间步长的数据。

本例:使用3个时间步长的数据预测后2个时间步长的数据,

数据处理:

数据集dateset
[10, 20, 30, 40, 50, 60, 70, 80, 90]

样本结构如下:
以下数据共有6个样本,每个样本中都是前三个时间步长的数据为一组作为输入,后两个时间步长的数据为另一组作为输出。

[10 20 30] [40 50]
[20 30 40] [50 60]
[30 40 50] [60 70]
[40 50 60] [70 80]
[50 60 70] [80 90]

即:
	输入			输出
[[10, 20, 30],		[[40,50],
[20, 30, 40],		[50,60],
……]					……		]

说明:后面的输入输出也都是这样分析,只是不再表明输入输出和完整的数组结构。

使用这样的数据训练一个模型后,我们就可以使用前连续三个时间步长的数据预测下一个时间步长的数据。

使用这样的数据训练一个模型后,我们就可以使用前连续三个时间步长的数据预测下一个时间步长的数据。

输入数据和输出数据的维度:
输入:两个维度,样本总数、用于预测的时间步长,这里分别是6、3
输出:两个维度,样本数据、预测的时间步长,这里分别是6、2

2 多变量时间序列数据预测

多变量时间序列数据是指,除了时间属性外,还有多个属性或者说特征的一组数据。
在这里插入图片描述

2.1 单步预测

2.1.1 多变量预测

多时间变量数据的单步预测(多变量单步预测,Multivariate Input Series):利用前面的多个时间步的部分属性数据,预测下一个时间步的某个属性数据,与单变量不同,这里每个时间步都有多个数据。以上边电耗数据为例。一种预测方式是:使用三个时间步的平均电流、平均电压的数据,预测一个时间步平均功率。

数据集处理:

[[ 10  15  25]
 [ 20  25  45]
 [ 30  35  65]
 [ 40  45  85]
 [ 50  55 105]
 [ 60  65 125]
 [ 70  75 145]
 [ 80  85 165]
 [ 90  95 185]]

划分样本
以下数据共有6个样本,每个样本中都是前三个时间步长的数据是平均电流和平均电压作为输入,后一个时间步长的平均功率作为输出。

[[10 15]
 [20 25]
 [30 35]] 65
[[20 25]
 [30 35]
 [40 45]] 85
[[30 35]
 [40 45]
 [50 55]] 105
[[40 45]
 [50 55]
 [60 65]] 125
[[50 55]
 [60 65]
 [70 75]] 145
[[60 65]
 [70 75]
 [80 85]] 165
[[70 75]
 [80 85]
 [90 95]] 185

使用这样的方式可以利用前三个时间步的电流、电压数据,预测当前功率(只给电流、电压信息)。

输入数据和输出数据的维度:
输入:三个维度,样本总数、用于预测的时间步长、用于预测的特征数,这里分别是6、3、2
输出:两个维度,样本数据、预测的特征数,这里分别是6、1

2.1.2 并行预测 (全变量预测)

多变量时间序列数据单步并行预测(多变量单步并行预测,Multivariate Multi-Step Parallel Series):使用前面几个时间步的所有属性数据,预测下一个时间步的所有属性数据。以上面的电耗数据为例,使用前3个时间步的平均电流、平均电压、平均功率预测下一个时间的平均电流、平均电压、平均功率。

数据集:

[[ 10  15  25]
 [ 20  25  45]
 [ 30  35  65]
 [ 40  45  85]
 [ 50  55 105]
 [ 60  65 125]
 [ 70  75 145]
 [ 80  85 165]
 [ 90  95 185]]

样本处理:

[[10 15 25]
 [20 25 45]
 [30 35 65]] [40 45 85]
[[20 25 45]
 [30 35 65]
 [40 45 85]] [ 50  55 105]
[[ 30  35  65]
 [ 40  45  85]
 [ 50  55 105]] [ 60  65 125]
[[ 40  45  85]
 [ 50  55 105]
 [ 60  65 125]] [ 70  75 145]
[[ 50  55 105]
 [ 60  65 125]
 [ 70  75 145]] [ 80  85 165]
[[ 60  65 125]
 [ 70  75 145]
 [ 80  85 165]] [ 90  95 185]

使用这样的方式可以利用前三个时间步的电流、电压、功率数据,预测时预测后面1个时间步长的电流、电压、功率。

输入数据和输出数据的维度:
输入:三个维度,样本总数、用于预测的时间步长、用于预测的特征数,这里分别是6、3、3
输出:两个维度,样本数据、预测的特征数,这里分别是6、3

2.2 多步预测

2.2.1 多变量预测

多时间变量数据的多步预测(多变量多步预测,Multiple Input Multi-Step Output):利用前面的多个时间步的部分属性数据,预测后面多个时间步的某个属性数据。以上面的电耗数据为例,一中预测方式是,使用前3个时间步的平均电流、平均电压预测后面2个时间步长的平均功率。
数据集:

[[ 10  15  25]
 [ 20  25  45]
 [ 30  35  65]
 [ 40  45  85]
 [ 50  55 105]
 [ 60  65 125]
 [ 70  75 145]
 [ 80  85 165]
 [ 90  95 185]]

样本处理:

[[10 15]
 [20 25]
 [30 35]] [65 85]
[[20 25]
 [30 35]
 [40 45]] [ 85 105]
[[30 35]
 [40 45]
 [50 55]] [105 125]
[[40 45]
 [50 55]
 [60 65]] [125 145]
[[50 55]
 [60 65]
 [70 75]] [145 165]
[[60 65]
 [70 75]
 [80 85]] [165 185]

使用这样的方式可以利用前三个时间步的电流、电压数据,预测时预测后面2个时间步长的平均功率。

输入数据和输出数据的维度:
输入:三个维度,样本总数、用于预测的时间步长、用于预测的特征数,这里分别是6、3、2
输出:两个维度,样本数据、预测的时间步长,这里分别是6、2

2.2.2 并行预测 (全变量预测)

多变量时间序列数据的多步并行预测(多变量多步并行预测,Multiple Parallel Input and Multi-Step Output):使用前面几个时间步的所有属性数据,预测下一个时间步的所有属性数据。以上面的电耗数据为例,使用前3个时间步的平均电流、平均电压、平均功率预测后面多个时间的平均电流、平均电压、平均功率。

数据集:

[[ 10  15  25]
 [ 20  25  45]
 [ 30  35  65]
 [ 40  45  85]
 [ 50  55 105]
 [ 60  65 125]
 [ 70  75 145]
 [ 80  85 165]
 [ 90  95 185]]

样本处理:

(5, 3, 3) (5, 2, 3)

[[10 15 25]
 [20 25 45]
 [30 35 65]] [[ 40  45  85]
 [ 50  55 105]]
[[20 25 45]
 [30 35 65]
 [40 45 85]] [[ 50  55 105]
 [ 60  65 125]]
[[ 30  35  65]
 [ 40  45  85]
 [ 50  55 105]] [[ 60  65 125]
 [ 70  75 145]]
[[ 40  45  85]
 [ 50  55 105]
 [ 60  65 125]] [[ 70  75 145]
 [ 80  85 165]]
[[ 50  55 105]
 [ 60  65 125]
 [ 70  75 145]] [[ 80  85 165]
 [ 90  95 185]]

使用这样的方式可以利用前三个时间步的电流、电压、功率数据,预测时预测后面2个时间步长的电流、电压、功率。

输入数据和输出数据的维度:
输入:三个维度,样本总数、用于预测的时间步长、用于预测的特征数,这里分别是6、3、2
输出:三个维度,样本数据、预测的时间步长、预测的特征数,这里分别是6、2、3