泰宁新闻网

推荐一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法与流程

泰宁新闻网 http://www.tainingxinwen.cn 2020-10-18 13:41 出处:网络
这里写的推荐一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法与流程,小编为您在线揭秘

这里写的推荐一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法与流程,小编为您在线揭秘


本发明属于电力系统的负荷技术领域,具体涉及一种基于gep参数优化xgboost的电力系统短期负荷预测方法。



背景技术:

负荷预测问题涉及电力系统规划和设计,电力系统运行的经济性、可靠性和安全性、电力市场交易等多个方面,它已成为现代化电力系统运行和管理中的一个重要领域。电力系统的主要任务是为各类用户提供经济、可靠和高质量的电能,以随时满足用户的负荷需求量和负荷特性的要求。为此,在电力系统规划设计、运行管理和电力市场交易中,必须对负荷需求量的变化和负荷特性有一个准确的预测。这就是人们不断研究并发展电力系统负荷预测理论的重要原因。

一直以来,短、中、长期的电力负荷预测一直是供电公司和研究人员的重要研究工作,也提出了大量的理论方法。其中,传统方法是以时间序列预测原理为基础建立的预测方法,包括自回归方法和累计式自回归滑动平均方法等一系列方法为代表,该类方法虽然模型简单且应用广泛,但是对时间序列的平稳性要求较高,预测误差较大。近年来,随着人工智能的兴起,出现了另一类以机器学习为理论基础的电力负荷预测算法,以人工神经网络和支持向量机方法为突出代表。这一系列机器学习算法有许多突出优点,包括对大量非结构性和非精确性规律有自适应功能、较好的预测对象泛化性能,但是也存在着优化过程复杂、收敛速度慢或误差大等一系列缺点,所以一个合理、准确的电力负荷预测方法在实际应用中显得尤为重要。

现有的针对短期负荷预测的方法多有预测精度低、过程复杂等缺点而不能实现对电力负荷的准确预测,因此提出一种新的有效的电力系统负荷预测的方法对电力系统的运行和管理意义重大。

根据xgboost模型来建立短期负荷预测的模型,将历史电力负荷数据作为训练样本数据,进行模型的训练。并且通过基因表达式编程算法对xgboost模型中的一些重要参数进行选取最优参。



技术实现要素:

发明目的:本发明的目的在于提供一种基于gep参数优化xgboost的电力系统短期负荷预测方法,通过对待预测日相似样本的选取和模型参数的调优,使用历史样本数据进行xgboost模型的训练,在训练完成后输入待预测样本,从而得到待预测的电力负荷特性;本发明进行电力系统短期负荷预测问题,本机制是一种策略性方法,通过使用本方法可以迅速准确的得到待预测日的负荷需求和负荷特性,保证电力系统运行和管理的高效和稳定。

技术方案:为实现上述目的,本发明提供如下技术方案:

一种基于gep参数优化xgboost的电力系统短期负荷预测方法,包括如下步骤:

1)将所有历史样本与待预测日进行加权面板数据灰色相似度关联分析,进行相似日选取,选取与带预测日特征相似度高的样本作为相似日集;

2)通过基因表达式编程算法优化参数将xgboost模型中的重要参数进行迭代遗传操作求取适应度以得到参数的最优解;

3)将相似日集作为训练集放入xgboost模型进行训练得到xgboost负荷预测模型;

4)将xgboost负荷预测模型建立好后,输入待预测日,通过该xgboost负荷预测模型计算输出待预测日的负荷特性。

进一步的,步骤1)中,所述的进行相似日选取,包括如下步骤:

1.1)将历史样本作为面板数据,x=[x1,x2,x3…xn],其中xi表示第i天的历史数据,选取影响电力负荷变化的一些关键因素,包括气象因素的温度、湿度、降雨等,构建特征向量,将时间序列分成多段,并在每一段选取影响因素在样本观测值的特征向量,进入步骤二;

1.2)构建面板数据灰色关联判断矩阵xid,xi(m,q)表示第i个样本中第m个因素关于第q个时间段所对应的负荷观测值;并且通过灰色关联算子对矩阵中的数据进行处理,进入步骤1.3);

1.3)使用主成分分析法计算各影响因素的权重,得到权向量;并将权向量对面板数据灰色关联判断矩阵加权,得到加权面板数据灰色关联决策矩阵fi;

1.4)将相似度高于该阈值的所有样本作为相似日集进行选取相似日样本集数据作为样本进行模型训练。

进一步的,步骤1.1)中,所述的将历史样本作为面板数据,是设历史样本有n个,关键影响因素有m个,将时间序列分成q段,若面板数据中的样本i关于影响因素s在时间p上的数值为xi(s,p),i=1,2,…,n,s=1,2,…,m,p=1,2,…,q:定义:

xi=(xi(1),xi(2),…,xi(m))t

其中:xi(s)=(xi(s,1),xi(s,2),…,xi(s,q)),t表示矩阵的转置;称xi(s)为这组面板数据的样本i关于影响因素的时间序列;设样本的矩阵形式表示为:

其中,xi(m,q)表示第xi个样本在第m种影响因素下第q个时间段的影响因素值;

步骤1.2)中,所述的构建面板数据灰色关联判断矩阵xid表示为:

其中,d为面板数据均值波动初始化算子,

设样本i和样本j(i,j=1,2,…,n,i≠j)两个不同的样本,两者在s影响因素下通过d初始化后的时间序列为:

xi'(s)=xi(s)d=(xi(s,1)d,xi(s,2)d,…,xi(s,q)d);

xj'(s)=xj(s)d=(xj(s,1)d,xj(s,2)d,…,xj(s,q)d);

步骤1.3)中,所述的使用主成分分析法计算各影响因素的权重,得到权向量为w=[w1,w2,…wm],式中wm为第m个影响因素的权重值;加权面板数据灰色关联决策矩阵fi是用得到的权向量对上述面板数据灰色关联判断矩阵xid进行加权得到加权面板数据灰色关联决策矩阵fi,表示为:

则加权后的样本i和样本j在s影响因素下时间序列为:xi”(s)、xj”(s)则两向量的夹角为:

其中<xi”(s),xj”(s)>为两个向量的夹角,单位为度(°)||xi”(s)||、||xj”(s)||分别为两个向量的模长;

步骤1.4)中,所述的将相似度高于该阈值的所有样本作为相似日集是根据计算历史样本矩阵与待预测日矩阵的样本相似性关联度,其中ρ(x0,xj)表示面板数据样本序列中x0与xj的相似关联度,将关联度从大到小排序,设置一个阈值,将相似度高于该阈值的所有样本作为相似日集。

进一步的,步骤2)中,所述的通过基因表达式编程算法优化参数包括如下步骤:

2.1)将xgboost模型所需的参数作为输入,通过基因表达式编程算法,初始化种群并进行适应度计算,保存最优个体,再进行选择操作输出种群数据r,进入步骤2.2);

2.2)将经过选择操作后的种群r,通过一系列基本遗传操作包括交叉、变异、重组后,生成下一代种群,进入步骤2.3);

2.3)计算步骤2.1)生成种群的适应度,若满足终止条件,则输出所得最优参数进入相似日样本集数据作为样本进行模型训练,否则回到步骤2.1)。

进一步的,步骤3)中,所述的将相似日集作为训练集放入xgboost模型进行训练,包括如下步骤:

3.1)将相似日样本集数据作为样本进行模型训练,xgboost模型目标函数如下:

其中:n'为相似日样本总个数,n'≤n,i'为第i'个样本,其中i'=1…n’,k为决策树总个数,ω(fk)为第k棵树的复杂度,yi′′为第i'个样本的所得的预测值;由训练损失l和正则化项两部分组成,其中正则化项是全部k棵树的复杂度求和,进入步骤3.2);

3.2)对正在进行的第k棵树的损失函数进行二阶泰勒展开,其中一阶偏导二阶偏导进入步骤3.3);

3.3)将损失函数带入目标函数得到近似值,并且去掉常数项,得到目标函数进入步骤3.4);

3.3)定义一棵树:fk(x)=wk(x),表示样本落入树k的叶子节点后与权重进行组合,进入步骤3.4);

3.4)定义一棵树的复杂度:γ、λ为常数,u为叶子节点的数量,进入步骤3.5);

3.5)根据前两个步骤,将函数化简,得到为关于wj'的一元二次方程,计算得目标函数的最小值,进入步骤3.6);

3.6)基于损失函数建立模型,对节点进行切分;根据损失函数的增益gain=objl+r-(objl+objr),寻找最佳分裂点;完成xgboost负荷预测模型的建立。

发明原理:本发明主要包括:相似日选取、gep算法优化参数、xgboost模型训练及预测;相似日选取主要是通过把所有历史数据作为面板数据,并对关键影响因素进行权重计算,构成加权面板数据灰色关联判断矩阵。通过计算待预测日和历史样本的相似度,选取相似度高的作为相似日集。gep优化参数主要通过该算法将xgboost模型中的重要参数进行迭代遗传操作求取适应度以得到参数的最优解。xgboost模型训练及预测主要是先将相似日集作为训练集对该模型进行训练,训练完成后将待预测日输入模型,得到预测值并输出。

有益效果:与现有技术相比,本发明的一种基于gep参数优化xgboost的电力系统短期负荷预测方法,主要用于预测电力系统的短期负荷。通过本发明,可以较为精确的预测到待预测日的负荷需求量和负荷特性,以达到为各类用户提供经济、可靠和高质量的电能、满足用户的目的。

附图说明

图1为基于gep参数优化xgboost的电力系统短期负荷预测方法的系统结构图;

图2为基于gep参数优化xgboost的电力系统短期负荷预测方法的流程示意图。

具体实施方式

为了更好地理解本发明专利的内容,下面结合附图和具体实施例来进一步说明本发明的技术方案。

如图1所示,主要包括:相似日选取、gep算法优化参数、xgboost模型训练及预测;图1中的相似日选取主要用于将所有历史样本与待预测日进行面板数据灰色相似度关联分析,选取与带预测日特征相似度高的样本作为模型的训练集以提高预测精度;gep算法优化参数是将xgboost模型中的重要参数通过该算法进行迭代遗传操作求取适应度以得到参数的最优解;xgboost模型训练及预测是将相似日集作为训练集进行模型的训练,用来预测待预测日的负荷特性。

一种基于gep参数优化xgboost的电力系统短期负荷预测方法,包括如下步骤:

1)将所有历史样本与待预测日进行加权面板数据灰色相似度关联分析,进行相似日选取,选取与带预测日特征相似度高的样本作为相似日集;

2)通过基因表达式编程算法优化参数将xgboost模型中的重要参数进行迭代遗传操作求取适应度以得到参数的最优解;

3)将相似日集作为训练集放入xgboost模型进行训练得到xgboost负荷预测模型;

4)将xgboost负荷预测模型建立好后,输入待预测日,通过该xgboost负荷预测模型计算输出待预测日的负荷特性。

1、相似日选取

在电力系统负荷预测中,为了提高预测精度,在历史样本中选取与待预测日样本相似度高的样本作为预测模型的训练集是前提条件。本专利中采用将电力系统中的选取的历史数据作为面板数据序列,选取影响电力负荷变化的一些关键因素,包括气象因素的温度、湿度、降雨等,并将观察的时间分段成为时间序列,将面板数据无差别的表示出来。并且通过灰色关联算子将数据初始化以及计算影响因素的权重,并用权向量对面板数据灰色关联判断矩阵加权,得到加权面板数据灰色关联决策矩阵f。用ρ(x0,xj)表示表示面板数据样本序列中x0与xj的相似关联度,两个样本之间的相似性由由两个样本的相似关联度大小所决定,ρ(x0,xj)的值越大表示待预测样本和该样本的相似度越高,在计算完所有的相似度后,从大到小进行排序,选取一个阈值,将相似度高于该阈值的所有样本作为相似日集。

设历史样本有n个,关键影响因素有m个,将时间序列分成q段,若面板数据中的样本i关于影响因素s在时间p上的数值为xi(s,p),i=1,2,…,n,s=1,2,…,m,p=1,2,…,q。定义:

xi=(xi(1),xi(2),…,xi(m))t

其中:xi(s)=(xi(s,1),xi(s,2),…,xi(s,q)),t表示矩阵的转置;称xi(s)为这组面板数据的样本i关于影响因素的时间序列。

(1)设样本的矩阵形式表示为:

其中,xi(m,q)表示第xi个样本在第m种影响因素下第q个时间段的影响因素值。

(2)设d为面板数据均值波动初始化算子,则xid表示为:

其中

设样本i和样本j(i,j=1,2,…,n,i≠j)两个不同的样本,两者在s影响因素下通过d初始化后的时间序列为:

xi'(s)=xi(s)d=(xi(s,1)d,xi(s,2)d,…,xi(s,q)d);

xj'(s)=xj(s)d=(xj(s,1)d,xj(s,2)d,…,xj(s,q)d);

(3)根据主成分分析法确定各影响因素的权重,得到权向量为w=[w1,w2,…wm],式中wm为第m个影响因素的权重值。用权向量对上述初始化后的矩阵进行加权得到加权面板数据灰色关联决策矩阵fi=xidw,表示为:

则加权后的样本i和样本j在s影响因素下时间序列为:xi”(s)、xj”(s)则两向量的夹角为:

其中<xi”(s),xj”(s)>为两个向量的夹角,单位为度(°)||xi”(s)||、||xj”(s)||分别为两个向量的模长;

(4)根据其中ξ∈(0,+∞),计算历史样本和待预测样本的相似性关联度,计算完成后,将所有关联度按从大到小进行排序,选取一个阈值,将相似度高于该阈值的所有样本作为相似日集。

2、基因表达式编程算法优化参数

遗传算法模拟了自然选择和遗传过程中发生的繁殖、交叉和变异现象,根据达尔文进化论提出的适者生存、优胜劣汰的自然法则,在遗传算子(选择、交叉、变异)的作用下,使种群逐代优化,产生优秀个体,最终搜索到最优解。基因表达式编程算法是遗传算法的改进,该算法融合了遗传编程和遗传算法的优点,提出了新型的进化算法:gep。在表达形式上,它继承了ga的定长线性编码简单快捷的特点;在基因表达式,它继承了gp的树形结构灵活多变的特点,用简单编码解决负载问题,相比较传统的进化计算。在本专利中,采用这种算法将xgboost模型中的较为重要的参数在该算法中进行迭代选取最优参数,以达到提高模型预测精度的效果。

xgboost模型的较为重要的参数有:基分类器个数(tree_num)、学习率(learning_rate)、最大树深(max_depth)、最小叶子权重(min_child_wight)以及正则化参数λ,初始化种群并进行适应度计算,保存最优个体,再进行选择操作输出种群数据,将经过选择操作后的种群通过一系列基本遗传操作包括交叉、变异、重组后,生成下一代种群,迭代计算适应度,当满足终止条件后结束算法,输出各参数的最优解。

3、xgboost模型训练及预测

xgboost是boosting算法的其中一种,是一种提升树模型,boosting算法的思想是将许多弱分类器集成在一起,通过加入新的弱学习器,来努力纠正前面所有弱学习器的残差,最终这样多个学习器相加在一起用来进行最终预测,准确率就会比单独的一个要高,从而形成一个强分类器。并且是在添加新模型时使用了添加正则化来减小误差。在本专利中,首先在模型中设置好由gep算法得到的最优参数,然后由相似日样本集数据作为样本进行模型训练,从一棵树开始,在前一棵树的残差下,增加一棵树使模型效果更好。xgboost模型的目标函数由训练损失l和正则化项两部分组成,其中正则化项是全部k棵树的复杂度求和。目标函数表示为:

其中:n'为相似日样本总个数(n'≤n),i'(i'=1…n')为第i'个样本,k为决策树总个数,ω(fk)为第k棵树的复杂度,yi′′为第i'个样本的所得的预测值。由于xgboost是一个加法模型,所以预测值是每棵树预测值之和,fk为每棵树的函数,即:

当训练到第k(1≤k≤k)棵树时,对正在进行的树的损失函数进行二阶泰勒展开,其中:

一阶偏导

二阶偏导

将损失函数带入目标函数得到近似值,并且去掉常数项,得到新的目标函数形式为:

定义一棵树:fk(x)=wk(x),表示样本落入树k的叶子节点后与权重进行组合;定义一棵树的复杂度:γ、λ为常数,u为叶子节点的数量。将函数化简,得到最终的目标函数:

为关于wj'的一元二次方程,计算可得目标函数的最小值,基于损失函数建立模型,对节点进行切分。根据损失函数的增益gain=objl+r-(objl+objr),寻找最佳分裂点。完成整个模型的建立。

(4)将xgboost负荷预测模型建立好后,输入待预测日,通过该xgboost负荷预测模型计算输出待预测日的负荷特性。将待预测日输入到训练好的模型中,输出预测值。

如图2所示,一种基于gep参数优化xgboost的电力系统短期负荷预测方法,包含以下步骤:

步骤一:将历史样本作为面板数据,x=[x1,x2,x3…xn],其中xi表示第i天的历史数据,选取影响电力负荷变化的一些关键因素,包括气象因素的温度、湿度、降雨等,构建特征向量,将时间序列分成多段,并在每一段选取影响因素在样本观测值的特征向量,进入步骤二;

步骤二:构建面板数据灰色关联判断矩阵,xi(m,q)表示第i个样本中第m个因素关于第q个时间段所对应的负荷观测值。并且通过灰色关联算子对矩阵中的数据进行处理,进入步骤三;

步骤三:并使用主成分分析法计算各影响因素的权重,得到权向量,并用权向量对面板数据灰色关联判断矩阵加权,得到加权面板数据灰色关联决策矩阵f,进入步骤八;

步骤四:根据计算历史样本矩阵与待预测日矩阵的样本相似性关联度,其中ρ(x0,xj)表示面板数据样本序列中x0与xj的相似关联度,将关联度从大到小排序,设置一个阈值,选择较大的历史样本作为相似日样本集,进入步骤五;

步骤五:将xgboost模型所需的参数作为输入,通过基因表达式编程算法,初始化种群并进行适应度计算,保存最优个体,再进行选择操作输出种群数据r,进入步骤六;

步骤六:将经过选择操作后的种群r,通过一系列基本遗传操作包括交叉、变异、重组后,生成下一代种群,进入步骤七;

步骤七:计算步骤五生成种群的适应度,若满足终止条件,则输出所得最优参数进入步骤八,否则回到步骤五;

步骤八:将相似日样本集数据作为样本进行模型训练,从一棵树开始,在前一棵树的残差下,增加一棵树使模型效果更好;xgboost模型目标函数由训练损失l和正则化项两部分组成,其中正则化项是全部k棵树的复杂度求和,进入步骤九;

步骤九:对正在进行的第k棵树的损失函数进行二阶泰勒展开,其中一阶偏导二阶偏导进入步骤十;

步骤十:将损失函数带入目标函数得到近似值,并且去掉常数项,得到目标函数进入步骤十一;

步骤十一:定义一棵树:fk(x)=wk(x),表示样本落入树k的叶子节点后与权重进行组合,进入步骤十二;

步骤十二:定义一棵树的复杂度:γ、λ为常数,u为叶子节点的数量,进入步骤十三;

步骤十三:根据前两个步骤,将函数化简,得到为关于wj'的一元二次方程,计算得目标函数的最小值,进入步骤十四;

步骤十四:基于损失函数建立模型,对节点进行切分。根据损失函数的增益gain=objl+r-(objl+objr),寻找最佳分裂点。完成整个模型的建立。进入步骤十五;

步骤十五;将待预测日输入到训练好的模型中,输出预测值,结束。

实施例

随着电力市场化的改革与发展,电力系统中的负荷信息也具有维度多、数据量极大、数据种类复杂。其中负载的信息对用户、企业和社会经济均有巨大的价值,涉及电力系统规划和设计,电力系统运行的经济性、可靠性和安全性、电力市场交易等多个方面。那么如何在已有的大量历史数据的基础上,建立模型,对电力负荷进行预测分析成为一个重要的研究方向。假如有某一地区的一段时间的准确历史负荷数据,并且将要对未来某一天的负荷特性进行判断。那么首先要通过相似度关联分析,选择与待预测日特性相似的样本,并且利用基因表达式编程算法得到预测模型的参数最优解,最后通过样本数据对xgboost模型的训练后,进行待预测日的电力负荷预测。

其具体的实施方案为:

(1)把所有历史数据作为面板数据,并对关键影响因素进行权重计算,构成加权面板数据灰色关联判断矩阵。通过计算待预测日和历史样本的相似度,选取相似度高的作为相似日集。

(2)主要通过基因表达式编程算法将预测模型中的重要选取参数进行迭代遗传操作求取适应度以得到参数的最优解,提高模型预测的准确性。

(3)将相似日集作为训练集输入到xgboost模型中进行训练,训练完成后得到功能完善、预测精确的模型。最终将待预测日输入模型,得到预测值并且输出。


技术特征:

1.一种基于gep参数优化xgboost的电力系统短期负荷预测方法,其特征在于:包括如下步骤:

1)将所有历史样本与待预测日进行加权面板数据灰色相似度关联分析,进行相似日选取,选取与带预测日特征相似度高的样本作为相似日集;

2)通过基因表达式编程算法优化参数将xgboost模型中的重要参数进行迭代遗传操作求取适应度以得到参数的最优解;

3)将相似日集作为训练集放入xgboost模型进行训练得到xgboost负荷预测模型;

4)将xgboost负荷预测模型建立好后,输入待预测日,通过该xgboost负荷预测模型计算输出待预测日的负荷特性。

2.根据权利要求1所述的一种基于gep参数优化xgboost的电力系统短期负荷预测方法,其特征在于:步骤1)中,所述的进行相似日选取,包括如下步骤:

1.1)将历史样本作为面板数据,x=[x1,x2,x3…xn],其中xi表示第i天的历史数据,选取影响电力负荷变化的一些关键因素,包括气象因素的温度、湿度、降雨等,构建特征向量,将时间序列分成多段,并在每一段选取影响因素在样本观测值的特征向量,进入步骤二;

1.2)构建面板数据灰色关联判断矩阵xid,xi(m,q)表示第i个样本中第m个因素关于第q个时间段所对应的负荷观测值;并且通过灰色关联算子对矩阵中的数据进行处理,进入步骤1.3);

1.3)使用主成分分析法计算各影响因素的权重,得到权向量;并将权向量对面板数据灰色关联判断矩阵加权,得到加权面板数据灰色关联决策矩阵fi;

1.4)将相似度高于该阈值的所有样本作为相似日集进行选取相似日样本集数据作为样本进行模型训练。

3.根据权利要求2所述的一种基于gep参数优化xgboost的电力系统短期负荷预测方法,其特征在于:步骤1.1)中,所述的将历史样本作为面板数据,是设历史样本有n个,关键影响因素有m个,将时间序列分成q段,若面板数据中的样本i关于影响因素s在时间p上的数值为xi(s,p),i=1,2,…,n,s=1,2,…,m,p=1,2,…,q:定义:

xi=(xi(1),xi(2),…,xi(m))t

其中:xi(s)=(xi(s,1),xi(s,2),…,xi(s,q)),t表示矩阵的转置;称xi(s)为这组面板数据的样本i关于影响因素的时间序列;设样本的矩阵形式表示为:

其中,xi(m,q)表示第xi个样本在第m种影响因素下第q个时间段的影响因素值;

步骤1.2)中,所述的构建面板数据灰色关联判断矩阵xid表示为:

其中,d为面板数据均值波动初始化算子,

设样本i和样本j(i,j=1,2,…,n,i≠j)两个不同的样本,两者在s影响因素下通过d初始化后的时间序列为:

xi'(s)=xi(s)d=(xi(s,1)d,xi(s,2)d,…,xi(s,q)d);

xj'(s)=xj(s)d=(xj(s,1)d,xj(s,2)d,…,xj(s,q)d);

步骤1.3)中,所述的使用主成分分析法计算各影响因素的权重,得到权向量为w=[w1,w2,…wm],式中wm为第m个影响因素的权重值;加权面板数据灰色关联决策矩阵fi是用得到的权向量对上述面板数据灰色关联判断矩阵xid进行加权得到加权面板数据灰色关联决策矩阵fi,表示为:

则加权后的样本i和样本j在s影响因素下时间序列为:xi”(s)、xj”(s)则两向量的夹角为:

其中<xi”(s),xj”(s)>为两个向量的夹角,单位为度(°)||xi”(s)||、||xj”(s)||分别为两个向量的模长;

步骤1.4)中,所述的将相似度高于该阈值的所有样本作为相似日集是根据计算历史样本矩阵与待预测日矩阵的样本相似性关联度,其中ρ(x0,xj)表示面板数据样本序列中x0与xj的相似关联度,将关联度从大到小排序,设置一个阈值,将相似度高于该阈值的所有样本作为相似日集。

4.根据权利要求1所述的一种基于gep参数优化xgboost的电力系统短期负荷预测方法,其特征在于:步骤2)中,所述的通过基因表达式编程算法优化参数包括如下步骤:

2.1)将xgboost模型所需的参数作为输入,通过基因表达式编程算法,初始化种群并进行适应度计算,保存最优个体,再进行选择操作输出种群数据r,进入步骤2.2);

2.2)将经过选择操作后的种群r,通过一系列基本遗传操作包括交叉、变异、重组后,生成下一代种群,进入步骤2.3);

2.3)计算步骤2.1)生成种群的适应度,若满足终止条件,则输出所得最优参数进入相似日样本集数据作为样本进行模型训练,否则回到步骤2.1)。

5.根据权利要求1所述的一种基于gep参数优化xgboost的电力系统短期负荷预测方法,其特征在于:步骤3)中,所述的将相似日集作为训练集放入xgboost模型进行训练,包括如下步骤:

3.1)将相似日样本集数据作为样本进行模型训练,xgboost模型目标函数如下:

其中:n'为相似日样本总个数,n'≤n,i'为第i'个样本,其中i'=1…n’,k为决策树总个数,ω(fk)为第k棵树的复杂度,yi’’为第i'个样本的所得的预测值;由训练损失l和正则化项两部分组成,其中正则化项是全部k棵树的复杂度求和,进入步骤3.2);

3.2)对正在进行的第k棵树的损失函数进行二阶泰勒展开,其中一阶偏导二阶偏导进入步骤3.3);

3.3)将损失函数带入目标函数得到近似值,并且去掉常数项,得到目标函数进入步骤3.4);

3.3)定义一棵树:fk(x)=wk(x),表示样本落入树k的叶子节点后与权重进行组合,进入步骤3.4);

3.4)定义一棵树的复杂度:γ、λ为常数,u为叶子节点的数量,进入步骤3.5);

3.5)根据前两个步骤将函数化简得为关于wj'的一元二次方程,计算得目标函数的最小值,进入步骤3.6);

3.6)基于损失函数建立模型,对节点进行切分;根据损失函数的增益gain=objl+r-(objl+objr),寻找最佳分裂点;完成xgboost负荷预测模型的建立。

技术总结
本发明公开了一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法,属于电力系统的负荷技术领域,在信息量大的电力负荷数据中研究短期负荷预测的方法,得出待预测日的电力负荷特性,它主要包含三个部分:相似日选取、GEP算法优化参数、XGBoost模型训练及预测;其中相似日选取将关键影响因素进行权重计算,构成加权面板数据灰色关联判断矩阵。计算选取与待预测日相似度高的数据作为相似日集;GEP算法优化参数通过GEP算法将预测模型中的重要参数进行迭代遗传操作求取适应度以得到参数的最优解,提高模型的准确性;XGBoost模型训练及预测将相似日集作为训练集输入到XGBoost模型中训练以得到功能完善、预测精确的模型。最终将待预测日输入模型,得到预测值并且输出。

技术研发人员:邓松;董霞;蔡清媛;岳东;袁新雅;陈福林;张建堂;祝展望
受保护的技术使用者:南京邮电大学
技术研发日:2020.02.17
技术公布日:2020.06.26

推荐一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法与流程的相关内容如下:

本文标题:推荐一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法与流程
http://www.tainingxinwen.cn/qitaxinxi/521298.html

0

精彩评论

暂无评论...
验证码 换一张
取 消