运用多变量线性回归-

发布时间:   来源:文档文库   
字号:
运用多变量线性回归(MVLR对电能品质调查的因子分析研究
摘要 在过去的二十年中,全世界已完成了相当多关于电力品质监测的研究项目在这些研究中收集的信息为预期的电气环境提供了一种具体的景象,并能帮助公共事业计划其与电力品质性能相关的未来电网。如果能采用一种适当的分析步骤,这些大量的从具备这种性质的大规模电力品质调查中的采样网点收集的数据就可能反映出关于电力品质或好或坏的影响。如果知道哪些特征因素在决定特有的电力品质干扰水平上更显著,那么可以预见,其他具有相同决定因素的网点也能反映相同的电力品质水平。这篇论文旨在评价在大规模电力品质调查中电力品质的干扰等级和影响电力品质水平或好或坏的因素。为此,在一份长期的电力品质数据中,澳大利亚国家电力品质标准调查数据已经做了分析并与这些显著的因素进行了对比。这些分析中,多变量线性回归MVLR已被认定为一种研究复杂电力品质数据影响因素的行之有效的工具。
关键词 因素研究 电力品质数据研究 电力品质检测
1.介绍
如果能采用一种合适的诊断程序,这些大量的从大规模电力品质调查中的采样网点收集的数据就可能反映出关于电力品质或好或坏的影响。从一组特定的监控网点获得的调查结果可以用来推测其他没有被监控的在物理运行状况和相似客户组合上具有相同特征的网点的电力品质运行状况。这对电网规划人员进行网路规划和其他相关的电力品质研究是有用的。只有在特定的网点上决定电力品质最有影响的那些特征被知道的情况下,上述情况才是可能的。
因子分析用来确定那些导致不良的或更好的PQ水平的因素。这样的分析结果被用在PQ管理,规划和报告在公共设施中的实践。
这篇论文旨在评价在澳大利亚9个公共设施中的70个网点的PQ干扰水平和影响PQ水平的或好或坏的因素。这些被监控网点的特征,在对厂址的选择,PQ监控器的位置,网点类型和各种各样的负荷类型中用来识别不同用户组合的负荷类型的调查测量值分析时所采用的方法都要详细说明。这些调查的数据是用多变量线性回归分析的。 基于本文介绍的这种因素分析模型,它决定了在调查中是否任何存在于那些类别变量(也就是网点类型和负荷类型)和PQ干扰水平间的关系都要测量。
2. 现有的调查数据的讨论
经过大量的针对因子分析的PQ数据分析技术的寻找之后表明MVLR是一种可靠的,有效的对PQ调查数据分析的分析工具。MVLR使得我们在没有因子分析所需的模型下认识得以发展。
A 选址
240/415V网络的测量点是根据相互参与的公共网络的实用效能选择的。这些网点遍布地理区域和整体供电点,还有各类负荷区,也就是主要的居民区,商业区,工厂,农村或偏远地区。这些测量点一组是在最可能反映电力品质问题的区域选取的,剩下的网点位置是从正常的电网部分选取的。共同的网点选取标准适用于所有情况。在选取的过程中,以下几点是要考虑的:
1 有历史故障的网络 2 反映支线长度和回路布置的操作图表|地图 3 对网络有主要影响的负荷信息 4 之前有关的调查数据 5 在调查末期主要计划的系统改变

B. 分变量定义
任何没有定量的变量都要分类。分变量的取值是几个可能的分类之一。在这项研究中定义分变量,(就是网点和负荷种类)是以从各个设备处获得的信息为基础的。当分析分类变量时,我们着重处理于特定类别的对象的数量和所占的比例(如网点和负荷的种类)一旦负荷类型被认定为属于居民类,商业类,工厂类,农村或偏远地区,相应的网点类型就被认定为贫乏的网点,也就是说极端网点通常选择在240/415V分配器(支路)的末端而一般网点通常选择在靠近11kV/ 415V变电所的支路或一个分配器的开始段。在选择具有特定电力品质问题的网点时,下面的指导需要遵守:
1 恒定的电压和在城镇郊区的不平衡居民区
2 有闪电倾向的下垂工业区域或者能够看到发动机启动影响的区域 3 城市中心外面具有谐波的商业区(如购物中心)
4 受到电容器整流和闪电影响的瞬态区域

网点的选择倾向于混合的分配器(居民区,商业区,工业去)即使一种负载可能处于支配地位。另一种选择倾向是指定具有可能被各自负载类型所控制的网点。
3.多变量线性回归(MVLR
A.概论
多变量线性回归能对分类变量如网点类型和负载类型等进行单一模型的拟合,并能将这些网点的具有单一扰动类型的电力质量数据分类之间的关系考虑在内。这种对于电力质量数据的因子分析能够容许不同因素的不均匀性代表,这种代表能够用来建立对所有网点的电力质量监控的有效见解。在这篇论文中,用MSExcel进行MVLR分析,规划求解加载项与最小二乘拟合。
用到MVLR的网点类型是: 网点类型(平均值,极值)
负载类型(居民区,商业区,工业区,农村,偏远地区)
到底是网点类型还是负载类型是决定PQ问题时最重要的因素是非常重要的。 例如,假设电压不平衡率是由下面的变量类型决定的 VUF = K0 + KSite (site type+ KLoad(Load typ
在这里,常数KSiteKLoad是由多变量线性回归的方法确定的,为了减少变量的数量,假设KSite(平均数KLoad(商业的为零,即它们包含于K0,方程是通过用最小二乘法所有常数融入MS Excel的求解器进行求解的。下面一节给出了该方法的描述。 B 该范例显示了MVLR的应用 假如,每个网点都是用以下分类的
网点类型(平均值,极值) 负载类型(居民区,工业区) 同时,假设需要确定在决定响电压不平均率因素中网点类型和负荷类型那个是最重要的因素 假设,电压不平衡因素(VUF
VUF = K0 + KSite (Com, Ind + KLoad (Av, Ext
在这里,常数KSiteKLoad是由多变量线性回归的方法确定的,为了减少变量的数量,假KSite(平均数KLoad(商业的为零,即它们包含于K0方程是通过用最小二乘法所有常数融入MS Excel的求解器进行求解的。下面给出2个实例更好地表达上述方法。 1:这个例子演示了当他们被强迫为零时如何将自然常数归并为K0 1 VUFs没有常数(K0引进: 网点类型 负载类型
郊区 CBD 商业 工业

VUF 0.2 0.3 0.2
0.1 上述的基础, a 区商业站点将有一个VUF的指标0.4(如下。0.2 + 0.2 b CBD商贸将会有一个VUF,0.5(如下。0.3 + 0.2 c 业将会有一个VUF郊区,i.e.0.2 + 0.1 0.3( d CBD工业将会有一个VUF,0.4(0.3 + 0.1 2 VUFs K0与不变: 在这节,常数(K0)通过使一些指标为0而引入,如此以使上面的配置数据不会受到影响如下:
网点类型 负载类型
K0 商贸 CBD 郊区 工业 VUF 0.4 0 0.1 0
-0.1 引进常数(K0后上面的指标按以下方法计算:
(a郊区商业站点将有一个VUF的指标0.4(如下。0.4 + 0 + 0 (bCBD商贸将会有一个VUF,0.5(如下。0.4 + 0.1 + 0 (c工业将会有一个VUF郊区,0.3(i.e.0.4 + 0 - 0.1 (dCBD工业将会有一个VUF,0.4(如下。0.4 + 0.1 0.1 例二:这个例子给出了个基于线性回归方程的对电压不平衡率的分析方法,这个方程是由一组和例1相似网点的电压不平衡率数据建立的。
100个网点的分析显示这些不平衡率可以通过(2)式很好地逼近理论值。
VUF = 0.5 + [0.3 (Suburban + 0.1 (CBD] + 0.1(Commercial + 0.2 (Industrial] (2 根据(2)式很多预测可以跟电压不平衡率联系起来,其中一些给出如下: a 与大量的商业郊区网点相关的预测VUF0.5+0.3+0.1=0.9 b 决定不平衡率的最重要的因素是郊区居民(其值在0.3的范围内) c 最低值出现在CBD网点的商业区。
4 澳大利亚PQ数据的因子分析 A概述
基于以上描述的方法,经过分析的调查数据描述了一种代表澳大利亚公共设施的因子分析模型。包括基于上述网点选择的扰动类型监控在内的调查细节都要进一步讨论。
测量的数据被分为两组,即那些由测井获得的数据一组,那些被当作不同事件而捕捉的数据一组。电能品质调查是用下面的电压数据进行调查的,这样的调查在每个网点都进行了近一个星期的时间。
记录的数量(持续的扰动 1.电压漂移, 2.电压谐波 3.稳态电压
通过对持续扰动的测量数据的分析,对每个网点的归一化指标都进行了计算。捕获量(离散扰动)的指标将被舍去,因为不是在所有网点都会测量这些量。 B.影响个别扰动指标的因素之间的关系
依靠与网点和负载类型相关的因素,分别对每个特有的扰动建立了以下分析。网点类型主要描述了每个网点的阻抗特性而负载类型主要是基于流过由各自负荷分量决定的负载的电流大小。
依靠对所有类型的扰动指标的MVLR分析得到的线性回归方程如下: 扰动指标= K0+KSitype(Av,Ex+KLtype(Rs,
(3


C. 漂移电压
在表1中,丢失了偏远网点的不平衡测量数据,这是因为下载这些网点数据的PQ监控器出现了错误。因此,这些网点不在不平衡分析之列。通常情况下,与商业区和工业区网点相比,居民区,农村和偏远地区的网点能反映有效的电压不平衡因素。这主要是因为居民区呈现了更多的单相不平衡负载,而在农村和偏远地区有更多的分散的和孤立的不平衡负载。


Unbalance Indices excluding Remote sites







age Extreme K0 Commer cial Industri al Residential Rur al

Fig.1 MVLR Analysis on Voltage Unbalance


1 电压不平衡的MVLR分析 网点类型 平均值
0 极值
0.111 商业
0 常量 K0 0.136 负载类型 工业
住宅
0.101 农村
0.091
0.005 MVLR分析显示,与网点类型相比负载类型导致了有效的不平衡水平。1 同样显示了就不平衡水平而言平均值和极值没有多大的差别。网点类型对决定电压不平衡率没有有效的贡献。K0(常数)和极值之间没有多大的差别(K0和极值分别为0.1360.111。当比较波动的指标时,负载类型的一个有效输入会在决定电压不平衡率好坏性能部件中产生大的波动。因此,结论是网点类型不是决定电压不平衡率水平好坏的有效因素。
对与商业和工业负载类型相关网点的电压不平衡因素影响的计算,
VUF (Ave, Com = K0 +KS (Average + KL (Commercial = 0.136+ 0 + 0 = 0.136 VUF的相关计算表明,工业和商业网点的不平衡因素影响些相似。工业和商业的平均网点和末端网点的值分别是0.1360.140.2470.252。末端网点就是那些远离如预期那样对电压不平衡率有更高影响的变压器的网点。同样,图1显示居民区和农村负载类型的不平衡因素影响是相似的。然而,据报告最差的不平衡水平网点是末端网点或居民区网点。影响电
压不平衡率最有效的因素是末端/居民区网点,其次是末端/农村网点。末端网点显示了和平均网点的一个显著差别,即网点类型之间相差0.11的因素。 2 影响漂移电压的因素
类型
VUF (Average, Commercial VUF (Average, Industrial VUF (Extreme, Commercial VUF (Extreme, Industrial
VUF 0.136 0.141 0.247 0.252 应该注意的是在上述的MVLR分析中排除的偏远网点只在研究电压不平衡率时才被考虑。如上述讨论,因为偏远网点的不平衡数据不会被那些网点的PQ监控器所记录。因此这种情况不适合谐波电压和稳态电压的研究。 D.谐波电压
调查记录了所有的70个网点的谐波数据并且没有数据丢失。因此对谐波的MVLR分析包括了调查中测量的网点。同样在这个分析中,为了保持一致性,商业网点和平均网点的指标被赋0,在这里那些值被合并到K0中。
如图表2中显示的MVLR分析结果那样,末端网点在系统中有最差的谐波水平;特别地就谐波而言,末端/商业网点是响应最差的网点,其次是末端/居民区,农村,工业和偏远区网点,与不平衡率和电压的分析相似,商业和工业区网点与谐波的电压的对比如下。
V olt age Har monic I ndices


0.15 0.1 0.05 0
Average Extreme K0 Commer cial Industrial Remote Resi denti al Rural -0.05 -0.1 -0.15


Fig.2 MVLR Analysis on Voltage Harmonics 3 影响谐波电压的因素
网点类型 负载类型 常量
K0 0.128 平均值
0 极值
0.054 商业
0 工业
-0.072 远程

住宅
-0.046 农村
-0.055
-0.107 分析显示商业区网点的与负载类型相关的谐波响应是最差的。其次是居民区,农村,工业区和偏远区网点。同样,末端网点是指那些在系统中远离与平均网点(即靠近变压器的那些网点)相比能导致更多谐波的变压器的网点。因此注意到,网点类型和负载类型都是实用电网
谐波响应的影响因素,在这些电网中末端/商业区网点是最差的谐波响应网点。 4 导致谐波电压 (VHARM的因素
类型
VHarm(Average, Commercial VHarm(Average, Industrial VHarm(Extreme, Commercial VHarm(Extreme, Industrial
VHarm 0.128 0.056 0.182 0.110 E. 稳态电压
MVLR分析中不平衡电压和谐波电压分析相同,为了保持一致性,商业网点和平均网点的指标被赋为0,在这里那些值被合并到K0中。与不平衡率分析相比,电压分析中的不同点显示K0和网点及负载类型之间的一个有效波动。网点类型和负载类型都是决定稳态电压水平优劣的因素。因此,靠近变压器或远离变压器的因素都是决定稳态电压的因素之一。
St eady Stat e V oltage Indices
0.25 0.2 .0.15 0.1 0.05 0
Av erage Ex treme K0 Commerci al Industr ial Remote Resi dential Rural


Fig.3 MVLR Analysis on Steady State Voltage 5 稳态电压的MVLR分析
网点类型 常量
K0 0.192 平均
0 极端
0.025 商业
0 工业
0.033 负载类型
远程
0.005 住宅
0.013 农村
0.024 至于不平衡电压和谐波电压,商业和工业网点的数据和表6中的稳态电压进行了比较 6 促成稳态电压的因素(SSV
类型
SSV(Average, Commercial SSV(Average, Industrial SSV(Extreme, Commercial SSV(Extreme, Industrial
SSV 0.192 0.225 0.217 0.250 如预期那样,通常末端网点是稳态电压响应最差的网点。MVLR分析显示对电压最有效的
影响因素是末端/工业区网点,其次是末端/农村,末端/居民区,末端/偏远地区和末端/商业区网点。然而,同样要注意的是在平均网点和末端网点之间没有明显的差别,都是0.025.工业区网点是影响稳态电压最有效的因素,其次是农村,居民区,偏远地区和商业区网点。
5结论
这篇论文讨论了与PQ调查数据相关的因子分析的应用。因子分析被用来确定那些能揭示导致实用网络中电能品质性能好坏因素的潜在模式和关系。在分析中,一份澳大利亚的PQ调查数据被当作了分析和比较的主要因素。多变量线性回归认定为一种对复杂电能品质数据进行因子分析的有用工具。
在分析中所考虑的基于可得到的调查数据的两个主要因素,即网点类型和负载类型。网点类型主要描述了阻抗特性而平均网点就是那些靠近变压器的网点,末端网点就是那些远离变压器的网点。负载类型是与电流扰动有关的一种类型,这种电流扰动出现在被定义为商业,工业,居民区,农村和偏远地区的负载类型的负载中。
研究发现影响PQ水平最有效的因素是负载类型,也就是不平衡率,谐波和稳态电压。然而负载类型和网点类型都是导致稳态电压的因素。
本文表明因子分析是一种具体的分析技术,它能够用来确定隐藏的模式和关系并可用MVLR分析完成。
进一步的研究应当以用数据挖掘技术进行因子分析为目的,并且通过对MVLR和数据挖掘技术的比较提出一种方案来确定哪种方法更适合这种分析。
参考文献
[1]Gosbell V.J.,Perera,宋文沛,史密斯,V.W.国家澳大利亚基准电能质量检验报告。体能源电能质量中心、卧龙岗大学、新南威尔士、澳洲,2001
[2]A.Agresti,”分类数据分析”,Wiley-Interscience,纽约,2002年。
[3] H.M.S. Chandana Herath博士论文“电能质量数据管理和澳洲配电行业方法报告 ”,卧龙岗大学,新南威尔士,澳大利亚,(暂缓提交)2008 [4]Gosbell, V.J., Perera, S., Herath, H.M.S.C.,连续干扰的统一电能质量指数UPQI 10日关于谐波和电能质量ICHQP'02IEEE国际会议,里约热内卢,巴西,200210月,卷 1,第316 -321页。
传记
Chandana Herath (S’2000: Herath先生目前是一位正在为(EA)工作的工程师,也是一个正在澳大利亚卧龙岗大学的积分能源电能质量中心(IEPQRC)攻读电能质量博士学位的研究生,他是ENA的可靠性和电能质量工作组和澳大利亚EL -034PQ标准委员会的代表。
Vic Gosbell (M’1972:
Gosbell博士是前IEPQRC的原技术总监和现行的技术顾问和澳大利亚卧龙岗大学动力工程的教授。他也是澳洲工程师学会的资深会员,现任卧龙岗大学高级研究员。他的研究方向是电力电子仿真,谐波和电能质量。
Sarath Perera (M’1988:
佩雷拉博士是在澳大利亚卧龙岗大学副教授,现为
IEPQRC技术总监。他的研究兴趣包括电能质量。
David Stirling (M’2001: 斯特林博士是位于澳大利亚卧龙岗大学的高级讲师。他的研究方向是机器学习和数据挖掘。



本文来源:https://www.2haoxitong.net/k/doc/cd812818ff00bed5b9f31d59.html

《运用多变量线性回归-.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式