• 热门标签

当前位置: 主页 > 航空资料 > 机场资料 >

时间:2010-07-10 22:46来源:蓝天飞行翻译 作者:admin
曝光台 注意防骗 网曝天猫店富美金盛家居专营店坑蒙拐骗欺诈消费者

(2) 差异表法[38]。该算法简单、直观,可以用关系数据库实现。
(3) 逐列消除法[39]。该算法对一致的决策表系统非常有效,不依赖于系统的
分辨矩阵,效率高,也易于用在关系数据库中实现。
一般来讲,一个决策表的条件属性对于决策属性的相对约简不是唯一的,
即对于同一个决策表可能存在多个相对约简。目前属性约简算法主要有:一般
约简算法,改进的基于分辨矩阵和逻辑运算的属性约简算法,归纳式属性约简
算法,基于互信息的属性约简算法[MIBARK 算法],基于特征选择的属性约简算
法等。各种算法之间的联系和区别参见文献[36],[41]。这里重点介绍一下本文
使用的改进的基于分辨矩阵和逻辑运算的属性约简算法。
设Redu 是决策表T 属性约简后得到的属性集合,该算法描述如下:
第1 步:将核属性列入属性约简后得到的属性集合,即Redu= 0 C ;
第2 步:在可变识矩阵中找出所有不包含核属性的属性组合S,即
Q= {Bi:Bi∩Redu ≠ ∅,i=1,2,…,s}, S=S-Q ;
第3 步:将属性组合S 表示为合取范式的形式,即
P= , { : ( 1,2, , ; 1,2, , )} i k ∧ ∨b i= …sk= …m ;
第4 步:将P 转化成析取范式形式;
第5 步:根据需要选择满意的属性组合。例如,如果要求属性数最少,可以
直接选择合取式中属性数最少的组合;如果要求规则最简,则需要进一步进行
属性值的约简。
3.2.3 Rough 集理论的属性值约简
通过属性约简,可以将决策表中对决策分类不必要的属性忽略,从而实现决
策表的简化,但是,属性约简只是一定程度上去掉了决策表中的冗余属性,我
24
们还需要进一步对决策表进行处理,得到更加简化的决策表,这就是我们说的
属性值约简。Rough 集理论还具有从信息表中提取规则知识的能力,事实上,对
信息表就行属性值约简的过程正是利用Rough 集理论提取规则的过程。
分析属性值约简,我们可以从值核入手。所谓值核是指,在信息表中的每
条记录中寻找对得出决策影响最大的属性值。目前属性值约简算法主要有:一
般值约简算法(数据分析法),归纳值算法,启发式值约简算法,基于决策矩阵
的值约简算法等。各种算法的比较参见文献[36],[42]。由于救援辅助决策系统
的数据大多存储在关系数据库中,本文着重介绍易于在关系数据库中实现的启
发式值约简算法。假设约简属性后的决策表为T′ ,算法描述如下:
第1 步:对T′ 中的每条记录进行逐列考察。若删除该列后产生冲突记录,则
保留冲突记录的原该属性值;否则,如果有重复记录,则将重复记录的该属性
值标记为'*';对于其他记录,将该属性值标记为'?'。
第2 步:删除可能产生的重复记录,并考察每条含有标记'?'的记录。若仅
由未被标记的属性值即可判断出决策,则将标记'?'改为'*';否则,将标记'?'
改为原属性值;若某条记录的所有条件属性均被标记,则标记'?'改为原属性值。
第3 步:删除所有条件属性均被标记为'*'的记录及可能产生的重复记录。
第4 步:如果两条记录仅有一个条件属性值不同,且其中一条记录该属性被
标记为'*',那么,对该纪录如果可由未被标记的属性值判断出决策,则删除另
外一条记录;否则,删除本记录。
3.2.4 Rough 集理论解决问题的一般过程
利用Rough 集理论进行知识约简(属性约简和属性值约简)的一般步骤如下:
(1) 数据预处理(决策表补齐,决策表离散化)
对于不完备的信息表,需要将其补齐成完备的信息表。目前常用的决策表
补齐算法主要有Mean Completer 算法, Combinatorial Completer 算法,
ROUSDITA 算法等。如果某些条件属性或决策属性的值域为连续值(如浮点型数
据),则在处理前必须进行离散化处理,对于有些离散数据,有时也需要将离散
值进行更高层次的离散化。目前常用的离散化算法有等距离划分法,等频率划
分法,Semi Naïve Scaler 算法,布尔逻辑和Rough 集理论相结合的离散化算
法,基于断点重要性的离散化算法,基于属性重要性的离散化算法等。各种算
法详细介绍参见文献[35],[36]。
(2) 决策表属性约简
首先检查决策表的一致性,如果决策表不一致,则将其转化成一致的决策
25
表。然后,根据不同的条件环境以及人们对属性约简的要求和期望的实际情况,
选择不同的属性约简算法,使得到的约简结果尽可能的少并且符合人们的期望。
(3) 决策表值约简
在属性约简的基础上,采用合适的值约简算法进一步简化决策表,从决策
表中提取出决策规则。
3.2.5 利用Rough 集理论时要注意的问题
利用Rough 集理论可以从历史数据中提取出决策规则,可以用这些提取出来
的规则可以辅助决策者对未来事件做出决策。但是,在智能信息的实际处理过
程中,经常遇到对事物的描述(决策属性)是定性的和定量的混合使用,表达可
能层次分明,也可能杂乱无序,定性的概念还可能是模糊的,定量的数据也可
能是不确定的等。具体说来主要有以下几个方面的问题:
① 决策系统中的数据类型通常多种多样。
② 决策系统中的数据有可能不完整(不完备)。
③ 决策系统中的数据有可能相矛盾(不相容)。
④ 决策系统的数据量往往是动态增加的。
对于前三个问题,我们需要在数据预处理阶段予以解决。如果数据类型多种
多样,那么就要进行离散归一化处理;如果数据不完整,就要进行决策表补齐;
如果数据不相容,就要根据实际要求进行去噪声处理。各种情况的具体讨论和
研究请查阅相关文献。
对于第四个问题,由于决策系统中的数据量动态增加,那么对应的决策规则
也应该随之变化。但是,我们不可能在数据记录每增加一条,就将整个知识约
简过程再进行一次以提取新的决策规则,这样做耗时耗力,效率低下。对于数
据量不断增加的决策系统,比较合理的解决办法是增量式知识获取算法[43]。该
算法的主要思想(对于一条新加入的记录)如下:
 
中国航空网 www.aero.cn
航空翻译 www.aviation.cn
本文链接地址:民用机场应急救援管理系统关键技术研究(8)