0 引言
随着电力系统朝着超高压、大容量的方向发展,对电力设备运行可靠性的要求不断提高。如大型电力变压器作为电力系统中重要的变电设备,其运行状态将直接影响到电力系统的安全运行。所以,如能迅速而准确地对其进行故障诊断,防患于未然,将是保障供电可靠性的重要手段之一。
电力变压器的故障实质上是一个模式分类问题,即根据各种各样的故障征兆,判断出故障发生的部位或区域。由于电力变压器故障征兆与故障原因之间存在着很多不确定因素,所以一种故障可能会引起多个征兆,而一种征兆又可能由几种故障引起。本文用粗糙集理论,考虑故障征兆信息的不准确、不完备性,提出一种电力变压器常见绝缘故障的诊断模型。
1 粗糙集理论
粗糙集理论(Rough Set Theory, RST)是Pawlak Z.及其合作者于1982年提出的一种处理模糊性和不精确问题的新型数学工具[1,2]。它的最大特点是不需要提供求解问题时所需处理的数据集合之外的任何先验信息,如统计中要求的先验概率和模糊集中要求的隶属度,即能有效地分析和处理不精确、不一致、不完整等各种不完备数据,并从中发现隐含的知识,揭示潜在的规律[3]。
1.1 粗糙集的上、下近似集[3]
在RST中,用等价关系代替分类,设U≠Φ是论域,R为U上的一族等价关系,二元对K=(U,R)构成一个近似空间(Approximation space)。R将论域U分成一族等价类Ei(i=1,…,n),Ei和空集Φ 称为R的基本集。如果U上的一个子集X不能用基本集的并集准确表示出来,则称X为粗糙集,粗糙集是用上近似集和下近似集两个精确集来描述的,其数学定义如下:
其中x为U中的一个对象,[x]R表示所有与x不可分辨的对象组成的集合,即由x决定的等价类。实际上R_(X)是U中包含在X中的最大可定义集,R-(X)是U中包含在X中的最小可定义集。
1.2 决策表[4]
信息系统IS(Information System)可表示为IS=〈U,A,Va,fa〉,其中U是对象的非空有限集合,称为论域;A是对象属性的非空有限集合,称为属性集合;Va=∪a∈AVaa是属性值的集合,Vaa表示属性a∈A的值域;f:U×A→Va称为信息函数。信息系统也称为知识表达系统.由这样的“属性—值”对就构成了一张二维表,称之为信息表(Information table)。
如果A由条件属性C和结论属性D组成,且C,D满足: C∪D=A, C∩D=ø
则称IS为决策系统(Decision System,简称DS)。
实际使用时,决策系统一般表示成一张决策表(Decsion table)的形式,每一列表示一个属性,每一行表示一个对象。
例1:假设一个由7个对象的简单决策系统,有4个条件属性c1,c2,c3,c4,一个决策属性d,如表1所示:
1.3 决策表的化简及分类规则的提取
决策表中的一个属性对应一个等价关系,一个决策表可看作是定义的一族等价关系。决策表中并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原有的表达效果。决策表的化简就是化简表中多余的条件属性,即去除冗余的条件属性,在删除这些属性后不会影响原有的表达效果,化简后的决策表具有更少的条件属性但具有化简前的决策表的功能。
决策表的简化步骤如下:
(1) 删除条件属性集合的冗余属性,找到所有约简。首先定义决策规则的协调性:相同的规则前代(即属性部)必然有相同的后继(即结论部);不同的规则前代允许有不同或者相同的后继;相同的后继允许相同或不同的前代。判断某一个条件属性冗余或可省的准则是:若去掉条件属性集中某属性后,算法中所有规则仍然协调,则该属性冗余而可省去;若有一个规则不协调,则该属性不可省。同理,依次单独去掉其他条件属性来考察规则的协调与否,去掉所有冗余条件属性。例如逐一除去表1中条件属性c1,c2,c3,c4,看看没有该列决策表是否协调。检查后发现c3是多余的,而c1,c2,c4是必需的属性。{c1,c2,c4}称为原条件属性集{c1,c2,c3,c4}的一约简。一个决策表的条件属性集可能存在多个约简。本例中只有一个,见表2。