主页 > 案例大全 > 论文技巧案例-燃煤机组空冷系统的大数据分析

论文技巧案例-燃煤机组空冷系统的大数据分析

2021-06-23 09:43:37

  随着人民生活水平日益提高,我国的能源消耗量也逐渐增加,虽然各种新能源发电日益兴起,但火力发电仍在电力行业中占据很大比例。我国“三北地区”煤炭资源丰富但水资源匮乏,使得直接空冷机组在该地区广泛使用。基于最佳背压原理可得机组背压对空冷系统的经济性有很大影响,因而建立直接空冷系统背压预测模型具有极其重要的意义。本文以北方某电厂为研究对象,对该机组全年运行数据进行分析,确定了影响机组背压的主要因素为风机转速、机组负荷和环境温度。文中以MATLAB软件为工具,BP神经网络为分析方法,将理论模型和实际数据相结合,以风机转速、机组负荷和环境温度为输入层,机组背压为输出层,建立直接空冷系统背压预测模型,通过不断修正处理输入层数据对模型进行优化,最终得到较高精度的背压预测模型,为直接空冷系统背压优化提供了理论依据。、

  我国是耗电大国,虽然各种新能源发电发展迅速,但火力发电仍旧占主体地位。“三北地区”煤炭产量丰富而水资源匮乏的这种反向分布,使得发电厂空冷技术得到了足够的重视[1]。电站空冷系统可以分为两类:直接空冷和间接空冷。直接空冷系统的结构比较简单,在实现空冷作用时所需要的运行元件较少,同时占地面积较小,经济性较强,能有效解决我国北方以及内陆地区的发电问题,因而在世界上获得了快速发展。

  在影响直接空冷机组的安全运行以及经济运行的诸多因素中,最为关键的因素就是机组背压,在一定范围内,若想提高机组的经济性,可以适当降低机组的背压。经研究表明,机组发电机功率与风机耗功量均与机组背压有密切联系,随背压变化必然存在一个背压值使得机组出力的增加量与风机耗功的增加量的差值达到最大即机组净功增量达到最大值,此时机组经济性最高,此时对应机组背压为最佳背压。在机组运行过程中,有诸多因素影响着机组背压,风机转速、环境温度、机组负荷、环境风向以及主汽流量温度压力等参数均为影响着机组背压的因素。因而如何控制这些相关因素使得机组达到最佳背压从而提高机组运行安全经济性极为重要。

  1.2直接空冷系统的研究现状

  在空冷机组发展的过程中,如何空冷机组的安全性是各位专家学者一直重视的一个问题,经研究表明:直接空冷机组的变工况特性决定了机组安全性。基于如何提高机组的安全性专家学者做出了很多研究。严俊杰[2]提出了直接空冷机组凝汽器压力变工况计算模型,研究了直接空冷机组的变工况特性,分析出了凝汽器压力与各个机组运行参数之间的变化关系,得出环境温度,环境风速,机组热负荷以及管内污垢热阻对空冷凝汽器压力的影响;李高潮[3]采用法对某600MW空冷机组进行变工况计算分析,采用控制变量法,分别绘制了环境气温、迎面风速以及机组排汽流量不变情况下机组的变工况特性,得出环影响凝汽器背压最主要的因素是环境温度,机组的迎面风速次之,最后是机组排汽流量,同时可以通过调节风机转速改变机组背压使得空冷机组能够安全经济运行。

  直接空冷机组安全性问题解决后,专家开始重视如何提高机组的经济性,在节省水资源的前提下降低机组煤耗并达到最好的发电效益。经研究表明:直接空冷机组背压是影响机组安全性的最终重要因素。基于如何控制机组其他相关参数调整机组背压以使机组在安全的前提条件下经济性达到最高这一问题,专家学者做出了很多研究。张学镭[4]分析了环境风对直接空冷系统换热性能的影响,分析出直接空冷系统性能下降的最主要原因是风机性能的下降,同时热风回流对系统性能也有一定的影响;翟永杰[5]通过运行数据预测分析某300MW直接空冷机组背压值,分析了背压与机组发电机功率与风机耗功的关系,计算了机组处于不同运行工况下的最佳背压,得出环境温度、机组负荷以及风机运行方式是影响机组背压的主要方式,机随着机组负荷以及环境温度的升高背压值逐渐增大。

  1.3本文主要研究内容

  基于最佳背压以及最佳转速理论,转速的变化可以直接改变机组背压,同时转速的增减会改变风机耗功量,直接影响机组的经济性。本文通过现场数据的采集、分析以及处理,研究机组运行时实时数据的变化情况,通过背压与其他参数的变化关系,确定影响直接空冷机组背压的主要因素,采用BP神经网络分析方法建立通过风机转速预测背压模型,建模后增加BP神经网络输入量修正背压预测模型,同时通过不断修正建模数据对背压预测模型进行优化,以达到通过部分已知参数而实现机组背压的预测,为电厂实际运行提供一个参考依据。

  第二章BP神经网络以及数据处理

  2.1 BP神经网络

  人工神经网络(ANN)是一种功能强大且应用广泛的处理技术,尤其是进行多种联系复杂的数据处理[6],神经网络的种类很多,其中最为常用的是BP神经网络,即也是本文的主要研究方法。BP神经网络[7]是误差反向的多层前向网络,其包括输入层、输出层以及若干个隐含层构成,层与层之间全连接,数据逐层向后传播,但是网络计算所得的权值则沿误差减小的方向逐层向前修正,最终误差逐渐减小。

  设计BP神经网络首先需要训练数集,本文使用MATLAB软件进行训练数集的建立,具体方法下文进行详述。本文进行BP神经网络设计时,隐含层数选择单个隐含层,通过增加神经元节点的个数即输入量的个数实现任意非线性映射。隐含层传递函数选择Sigmoid函数,输出层使用线性函数。创建BP神经网络的函数有newff函数以及feedforwardnet函数,newff函数后来不再推荐使用,故本文采用feedforwardnet函数创建BP神经网络。

  2.2数据的采集及预处理

  2.2.1数据的采集

  以北方某直接空冷机组为研究对象,取出该机组2018年全年实时运行数据,间隔30s为一组,共计1048555组数据,其中包括该直接空冷机组的机组负荷、风机转速、流量以及总耗功、主汽流量、温度以及压力、环境温度、机组背压。

  2.2.2数据的预处理

  将直接空冷机组全年运行数据导入MATLAB中构建训练数集,在导入过程中,部分数据导入错误为NaN值,为保证这部分导入错误数据不影响后期数据建模,因而需要去除数据矩阵中的NaN值,剩余1028380组数据。在电厂运行过程中,还存在正常的机组检修设备停机以及部分异常工况而导致机组停机的情况,因而在建模过程还去除了机组运行过程中机组负荷小于50MW的数据,最终剩余821840组数据。由于全年运行数据过多,必然会导致数据处理以及建模速度过慢,因而在本文中将数据按照特定的映射关系将数据缩放到[-1,1]区间内,即对数据进行归一化处理,减少了建模所需要的时间,在进行模型误差分析计算时,可以将预测得到的进行反归一化操作已得到预测处的背压值[8]。

  2.3直接空冷机组背压影响因素分析

  电厂采集的运行数据包括机组负荷、风机转速、流量以及总耗功、主汽流量、温度以及压力、环境温度。利用Pearson函数[9]以及corrcoef函数分析以上各相关因素与背压的相关度,从而确定直接空冷机组背压预测模型输入层。Pearson函数计算公式为

  (2-1)

  式中N为变量取值的个数。

  相关系数r的绝对值越接近于1,说明两组数据的相关程度越高。相关系数处于0.8-1之间为极强相关,0.6-0.8为强相关,0.4-0.6为中等程度相关,0.2-0.4为弱相关,0-0.2为极弱相关或无相关[10]。各因素与直接空冷机组背压的相关系数如图2-1所示。

  图2-1各因素与直接空冷机组背压的相关系数

  由图2-1中数据可得,环境温度、风机转速、电流以及耗功、主汽流量与机组背压为强相关,机组负荷,主汽压力与机组背压为中等程度相关,主汽温度与机组背压为弱相关。如若选择除主汽温度以外其他因素均为直接空冷机组背压预测模型的输入层,则该模型会因输入参数过多而使其使用限制过大,没有使用价值。通过进行相关因素分析,机组负荷与主汽流量的相关系数为0.9986,二者极强相关,但是在现场运行过程中,主汽流量不容易监测,因而选择机组负荷为背压预测模型的一个输入量。风机转速与风机电流的相关系数为0.9850,风机转速与风机耗功的相关系数为0.8516,均为极强相关,风机转速在运行现场风机转速具有调控作用,同时结合最佳背压原理以及最佳转速原理,风机转速对机组耗功以及机组出力均有影响,因而选择风机转速为背压预测模型的另一输入量。环境温度与机组背压的相关系数为0.7057,二者为强相关。综上分析可得,直接空冷机组背压预测模型的输入量可选择机组负荷、风机转速以及环境温度。

  2.4本章小结

  本章主要介绍了BP神经网络的基本工作原理以及与其相关的部分函数,其次介绍了原始数据的采集以及处理方法,通过相关性分析计算了各相关因素与机组背压的相关系数,同时考虑了其他因素之间的相互联系,最终分析得知影响机组背啊的主要因素为机组负荷,风机转速以及环境温度,确定了背压预测模型的输入层。

  第三章直接空冷机组背压预测模型的建立

  3.1直接空冷机组背压预测模型评价指标

  建立直接空冷机组背压预测模型后,可通过一下几个参数分析型模型的性能参数:

  1.均方误差(MSE):所有样本的样本误差的平方的均值,均方误差越接近于0,模型越准确。计算公式如3-1所示。

  (3-1)

  2.均方根误差(RMSE):均方根误差的算术平方根,在数量级上较为直观,且越接近于1,模型越准确。计算公式如3-2所示。

  (3-2)

  3.平均绝对误差(MAE):所有样本的样本误差的绝对值得均值,且越接近于1,模型越准确。计算公式如3-3所示。

  (3-3)

  4.平均绝对百分比误差(MAPE):所有样本的样本误差的绝对值占实际值的比值,越接近于1,模型越准确。计算公式如3-4所示。

  (3-4)

  以上各式中N代表样本个数,代表背压的真实值,代表背压的预测值。

  原始数据经过预处理去除停机工况后,机组背压值均大于0,因而上述四个性能参数中,均方误差(MSE)与平均绝对误差(MAE)计算结果一致,故在下文进行模型性能参数比较时只考虑均方误差(MSE)。

  3.2单因素预测机组背压

  在建模分析过程中,采取机组全年运行数据的前80%作为建模时的训练集,进行BP神经网络的训练,后20%数据作为误差分析集,然后通过上述模型评价指标对该模型性能进行评价。经上文分析所得,环境温度、风机转速以及机组负荷是影响机组背压的主要因素,因而本节分别采用以上三个因素作为BP神经网络的输入层,机组背压为输出层,隐含层神经元个数为10,建立机组背压预测模型并对模型进行误差分析。

  (a)机组负荷预测背压拟合图像

  (b)风机转速预测背压拟合图像

  (c)环境温度预测背压拟合图像

  图3-1单因素变量背压预测拟合图像

  由图3-1分析可得,风机转速为输入层时背压预测拟合程度最高,而机组负荷为输入层时预测值明显偏离真实值。根据表3-1内数据分析可得,在单变量转速预测背压时,机组负荷预测背压是MAPE为21.0132%,在相关性分析中,三因素中机组负荷与机组背压相关系数最小,相关性最差,而此时机组负荷预测背压的MAPE也最大,与相关性分析结果一致,因而在后续预测过程中将机组负荷作为边界条件进行考虑。风机转速和环境温度预测背压时MAPE相差不多,但环境温度在现场运行时不易控制,且自然环境也不受人为控制,而风机转速在现场运行过程具有调控作用,通过调整风机转速的变化可以达到调整机组负荷的目的,同时通过风机转速也可以计算出风机耗功,进而故选择风机转速作为预测背压的主要因素,环境温度也作为一个边界条件。

  表3-1单因素变量预测背压模型各性能参数

  输入层隐藏层个数MSE RMSE MAPE

  风机转速10 4.6122 2.1476 6.5919%

  机组负荷10 7.6289 2.7621 21.0132%

  环境温度10 4.5326 2.1290 7.3322%

  3.3多因素预测机组背压

  采用单因素进行背压预测时,三种模型的误差均比较大,最终确立了风机转速为主要参数,因而可以考虑在使用风机转速预测背压的过程中加入一定量的边界条件观察是否可以提高模型的精度,由上文分析可得,机组负荷和环境温度可作为边界条件,经过两种边界条件组合建立了三种不同边界条件的背压预测模型,即分别以机组负荷为边界条件、以环境温度为边界条件、以机组负荷和环境温度共同为边界条件建立背压预测模型。建模时仍采取全年前80%数据为训练集,后20%数据为误差分析集,BP神经网络输入层为风机转速以及附加的各边界条件,输出层为机组背压,隐含层神经元个数为10。

  (a)风机转速+机组负荷预测背压拟合图像

  (b)风机转速+环境温度预测背压拟合图像

  (c)风机转速+负荷+环境温度预测背压拟合图像

  (d)转速+负荷+环温+主汽流量预测背压拟合图像

  图3-2多因素变量背压预测拟合图像

  由图3-2分析可得,多变量转速预测背压效果明显好于单变量转速预测背压,背压预测曲线拟合程度明显提高。风机转速预测背压的MAPE为6.5919%,由表3-2分析可得,在风机转速预测背压的基础上,分别加入机组负荷以及环境温度为边界条件时MAPE为6.4608%,6.1054%,MAPE均减小,说明背压预测模型性能增强,说明在背压预测模型建立的过程中,加入一定的边界条件可以使模型精度增强。同时将机组负荷和环境温度作为边界条件时,背压预测模型MAPE为5.1203%,模型精度继续增强。在机组背压相关性分析中,主汽流量也为一个强相关因素,因而考虑将主汽流量也作为一个边界条件看是否可以减小误差。在风机转速、机组负荷以及环境温度的基础上为边界条件的基础上再加入主汽流量,背压预测模型的MAPE为5.1280%,加入主汽流量后,背压预测模型的MAPE没有太大变化,说明再加入过多的边界条件对于模型的精度没有太大影响,反而会对模型的输入量有了更高要求,同时建模速度也减慢。因而最终选择以风机转速为主要因素,机组负荷和环境温度为边界条件建立背压预测模型。

  表3-2多因素变量预测背压模型各性能参数

  输入层隐含层数MSE RMSE MAPE

  风机转速+机组负荷10 4.4939 2.1198 6.4608%

  风机转速+环境温度10 4.3685 2.0901 6.1054%

  风机转速+机组负荷+环境温度10 0.2702 0.5198 5.1203%

  风机转速+机组负荷+环境温度+主汽流量10 0.2707 0.5203 5.1280%

  3.4本章小结

  在建立直接空冷机组背压预测模型过程中,分别以风机转速、机组负荷以及环境温度作为输入层时建立背压预测模型并对其误差性能评价指标进行比较,确立了风机转速为背压预测模型的主要因素。在风机转速预测背压的基础上,将机组负荷、环境温度以及主汽流量作为边界条件建立背压预测模型并进行比较,最终确定风机转速为主要因素,机组负荷和环境温度同时作为边界条件时,背压预测模型精度最高。

  第四章直接空冷机组背压预测模型的优化

  4.1建模数据的选取

  在背压预测模型建立的过程中,选取全年数据的前80%为训练集进行建模,后20%的数据为误差分析集进行误差分析,在机组全年运行过程中,每天外界环境温度不同,各个月份环境温度的变化趋势不同,在不同月份内发电量不同,使得机组运行状况不尽相同,同时建模数据与误差分析所使用的数据相关性较小,所以误差相对而言较大。为使建模时使用的数据与误差分析时所使用的数据一定的相关性,即为相似运行工况下机组运行的参数,因而在选取数据时从每月中取80%的数据作为建模的训练集,剩余20%数据进行误差分析。去除数据导入MATLAB中的NaN值以及停机工况,全年剩余数据821840组,为避免数据分月份的复杂性,因而直接粗略的数据直接平均分为12份,最终建模的训练集共657479组,误差分析数据共164376组。建模选取风机转速作为主要因素,机组负荷和环境温度为边界条件,将这三个参量作为输入层,机组背压为输出层,隐含层神经元个数为10。

  图4-1风机转速+机组负荷+环境温度背压预测拟合图像(每月80%)

  由表4-1分析可知:如若按照全年前80%的数据进行建模,后20%的数据进行误差性能分析,模型的MAPE为5.1203%,而取全年每月80%的数据进行建模,20%的数据进行误差性能分析时模型的MAPE为3.9658%,背压预测模型的精度明显提高,且由图4-1观察可得,机组背压预测拟合曲线较图3-3(c)而言,拟合程度有了很大的提高,说明若以相似工况下数据进行建模分析时,背压预测模型的误差明显减小。

  表4-1选取每月80%数据建模时背压预测模型各性能参数

  输入层隐含层个数MSE RMSE MAPE

  全年前80%10 0.2702 0.5198 5.1203%

  每月80%10 0.2323 0.4820 3.9658%

  4.2滑动窗口法处理数据

  在建模采取的全年运行数据中,除去导入MATLAB中NaN值以及停机工况外,还有部分原因会导致机组背压突然发生变化。在夏季冬季极限温度下,虽然可以通过调整机组负荷控制机组背压,但是还会出现一部分背压值超过直接空冷机组背压的极限值[11];在机组运行的过程中,会出现风机叶片扭转弯曲,风机电机故障等其他故障工况会使机组背压偏离正常范围;空冷岛管束翅片春季可能因为柳絮等物体吸入,或者夜间照明设备所吸引的飞蛾尸体等物质导致空冷岛翅片脏污,在这种条件下运行,机组背压会偏离正常值;在夏季机组运行过程,外界风向风速发生变化时,容易向直接空冷机组的空冷风机入口吹入部分热空气,产生“热风回流”回流现象,这种情况下,机组背压会迅速增高[12]。这些突然偏离机组正常背压的数据会使背压预测模型的误差增大,因而这部分数据也需要剔除。拉伊达准则[13]是常用的数据处理方法,可以算出被测样本的算术平均值以及剩余误差,同时可根据贝塞尔公式计算出样本的标准偏差,将样本中偏离3倍标准偏差的数据进行筛除,由于全年数据量过多,且不同环境温度下对应的机组背压值差异较大,因而采用滑动窗口法[14]与拉伊达准则结合进行数据的筛选。本文中采取一个小时,六个小时,以及十二小时数据量大小进行筛选,即滑动窗口分别选取120,720,1440,数据处理后得到的稳态数据分别为820702,819542,818568。建模时选取风机转速为主要因素,机组负荷和环境温度为边界条件,训练集选取每月数据的80%,剩余20%数据进行误差分析,隐含层神经元个数为10。

  (a)滑动窗口为0

  (b)滑动窗口为120

  (c)滑动窗口为720

  (d)滑动窗口为1440

  图4-2不同滑动窗口下的背压预测拟合图像

  图4-2中滑动窗口为不同值时的背压预测拟合曲线拟合程度相差不多。由表4-2数据可得,滑动窗口为1440即12小时时,背压预测模型的MAPE最小,此时效果最好。如继续增大滑动窗口可能会使运行过程中部分特殊运行参数去除,反而使背压预测模型的实用性减小。

  表4-2不同滑动窗口下背压预测模型各性能参数

  滑动窗口数据量MSE RMSE MAPE

  0 821840 0.2323 0.4820 3.9658%

  120 820702 0.2354 0.4852 3.9841%

  720 819542 0.2132 0.4617 3.9228%

  1440 818568 0.2088 0.4570 3.8035%

  4.3隐含层个数优化

  影响BP神经网络性能的因素有很多,其中隐含层神经元节点数是较为重要的因素,一般而言,隐含层神经元节点数越多,BP神经网络的性能越好,但是随神经元节点数的增多也会增加训练时间,因而如何选取较为合适的神经元节点数就极为重要[15]。但目前仍然没有一个较为理想的解析式来确定BP神经网络的隐含层神经元节点数,这是BP神将网络目前而言难以解决的一个缺陷,目前主要是采取部分经验公式确定隐含层神经元节点数,本文采用以下解析式进行预估:

  (4-1)

  式中

  m为输入层神经元节点数

  n分输出层神经元节点数

  a为[0,10]之间的常数。

  建模时输入层神经元个数为3,输出层神经元个数为1,由上式可得,隐含层神经元个数为2到12。MATLAB使用feedforwardnet函数创建神经网络时隐含层神经元节点数一般为默认值为10,因而下文中分别采取隐含层神经元节点数为2,5,8,12进行分析,判断出隐含层神经元个节点数为何值时神经网络预测性能最好。在建模过程中,同样以每月80%的数据为训练集,20%的数据为误差分析集,BP神经网络的输入层为风机转速、机组负荷以及环境温度,输出层为机组背压,在建模过程中修改feedforwardnet函数对应神经元节点数出的函数表达式,可以达到修改节点数的目的。

  (a)隐含层为2

  (b)隐含层为5

  (c)隐含层为8

  (d)隐含层为12

  图4-3不同隐含层节点数下的背压预测拟合图像

  由表4-3数据分析所得,隐含层节点数为8时,背压预测模型的MAPE最小,但是在神经元节点数为8,10,12时,模型精度变化不大,且图形的拟合程度也想差不多,因而在下文中使用feedforwardnet函数创建BP神经网络时隐含层神经元节点数仍然采取默认值10。

  表4-3不同隐含层下背压预测模型各性能参数

  隐含层神经元个数MSE RMSE MAPE

  2 0.2317 0.4814 4.0102%

  5 0.2519 0.5019 3.9837%

  8 0.2254 0.4747 3.9199%

  10 0.2323 0.4820 3.9658%

  12 0.2315 0.4811 3.9675%

  4.4分季度建立背压预测模型

  由表4-1中可得,建模数据选取每月80%数据作为训练集相对于全年数据的前80%数据作为训练集时,背压预测模型的MAPE明显减小,说明建模数据的选取对于背压预测模型的性能参数有很大的影响,即采用相似工况下数据建模会提高背压预测模型的精度。北方全年气温变化较大,夏季温度较高,冬季温度较低,春秋季温度较为接近,在夏季外界环境温度较高的情况下,机组背压值相对较高,在冬季温度较低的情况下机组背压较低,因为将建模数据继续进行细化分类。由于数据经过滑动窗口法处理,所以难以精确分类出每月数据,因而将滑动窗口为1440处理后的数据平均分为12份代表全年十二月的数据,每三个月数据分别为春、夏、秋、冬的数据,同时依旧选取每季度每月80%的数据作为训练集,剩余20%数据进行误差分析,输入层为风机转速,机组负荷以及环境温度,输出层为机组背压,选取隐含层神经元节点数为10。

  (a)春

  (b)夏

  (c)秋

  (d)冬

  图4-4不同季度下背压预测模型拟合图像

  由表4-4数据分析可得,相对于按照全年数据的80%作为训练集建立背压预测模型而言,夏季和秋季两季度背压预测模型的MAPE明显减小,且在图4-4(b),(c)两图中,图像拟合效果特别好,但是春季和冬季两季度的MAPE明显增大,图4-4(a),(d)中图像拟合效果较差,部分区域背压预测曲线明显偏离真实背压曲线,根据图像分析可得,春季和冬季的背压虽然背压波动幅度脚线,但是背压波动较为频繁,可能是因为春季和冬季两季度昼夜温度变化较为明显,机组背压值波动频率比较高,因而使背压预测模型的精度减小。