一、A potential reduction algorithm for an extended SDP problem(论文文献综述)
王敬前[1](2021)在《覆盖粗糙集与模糊粗糙集及其在化工过程故障诊断中的应用》文中研究指明化工过程反应复杂,具有高度非线性、连续性和时变性等特点,一旦发生故障,将会给经济和生命安全带来严重的损失。因此,如何从海量工业数据中挖掘出有用信息,进行化工过程的故障诊断成为当前研究的热点。随着当今人工智能的发展,故障诊断技术也进入了一个新的时代。但对于多故障诊断和不完备信息下的故障诊断等问题,还有待进一步探索。粗糙集理论和模糊集理论是人工智能领域两种处理信息系统中不完备和不确定性数据的重要工具。目前,模糊集理论在故障诊断领域已得到了较为广泛的应用,而粗糙集理论在该领域中的应用还处在刚刚起步的阶段。本文通过融合覆盖粗糙集与模糊粗糙集,针对田纳西伊斯曼(TE)化工过程、化工汽轮机组和聚合釜三类化工过程的故障诊断,研究了覆盖粗糙集模型与模糊覆盖粗糙集模型中的相关不确定性问题,建立了相关数据分析与挖掘的理论体系,为解决化工过程故障诊断提供了更加智能的方法。本文的主要工作与贡献如下:1)针对不完备信息条件下的故障诊断问题,利用覆盖粗糙集提出了从不完备信息故障特征中剔除冗余信息的方法,从而提高了传统故障诊断的准确率,并将其应用在化工汽轮机组的故障诊断中。首先,从矩阵的角度研究了覆盖粗糙集中有关最大、最小描述的相关问题,并利用机器学习库中的公开数据集与传统的计算方法做比较,实验结果表明基于矩阵的计算方法节省了计算时间。借助于上述最大描述的矩阵计算方法,提出了计算不完备信息系统中极大相容块的矩阵计算方法,很好得解决了数据维数过高时,计算耗时的问题。接着,通过极大相容块,将原不完备决策表转化为极大相容块最全描述决策表。在新的决策表基础上,提出了基于分辨矩阵的属性约简计算方法。最后,基于所提出的基于极大相容块的属性约简方法,建立了“极大相容块+智能分类器”的故障诊断方法,为解决不完备信息条件下的故障诊断问题提供一种新方法。并针对不完备信息条件下化工汽轮机组的故障诊断问题,进行了仿真实验。实验结果表明,若智能分类器分别选择支持向量机(SVM)、随机森林和决策树,则所提出的“极大相容块+智能分类器”故障诊断方法的准确率均为87.5%,而只使用上述智能分类器的故障诊断准确率最高只有75%,准确率至少提高了 12.5%。2)针对完备信息条件下的故障诊断问题,利用模糊覆盖粗糙集提出了从完备信息故障特征中剔除冗余信息的方法,从而提高了传统故障诊断的准确率,并将其应用在TE化工过程的故障诊断中。理论方面:首先,作为模糊β-覆盖近似空间中已有可约元和约简概念的补充,提出了I-可约元和I-约简的概念。在此基础上,研究了模糊β-最小描述与β-约简之间的等价刻画、模糊β-最大描述与β-核之间的等价刻画等问题。然后,将上述一个模糊β-覆盖近似空间中的概念推广到了两个模糊β-覆盖近似空间中,得到了新的概念及相关性质。在上述所有结果的基础上,一个模糊β-覆盖与其诱导的七个模糊β-覆盖之间关系,及这些模糊β-覆盖的格结构被研究。应用方面:基于以上模糊覆盖粗糙集模型,提出了一种基于模糊β-邻域的属性约简方法。并在此基础上,建立了“模糊覆盖粗糙集+SVM”的智能故障诊断方法。最终,以TE化工过程为背景,针对以下4种状态:正常、阶跃故障(由过程变量的阶跃变化引起的故障)、漂移故障(化工反应动力学的缓慢漂移引起的故障)和阀门粘滞故障,建立了模糊覆盖信息系统,通过所提出的基于模糊β-邻域的属性约简方法,从53个故障征兆属性中确定出23个作为故障特征,然后通过建立的“模糊覆盖粗糙集+SVM”方法进行了故障诊断仿真实验,其准确率为86.57%,而只使用SVM的方法得到的准确率为72.50%,准确率提高了 14.07%。3)在前两部分的基础上,为更有效地表达故障诊断中的各种不确定性信息,建立了若干广义模糊覆盖粗糙集模型及相关故障决策方法,并研究了其在聚合釜的故障诊断中的应用。首先,基于已有的直觉模糊β-覆盖近似空间和直觉模糊β-邻域的概念,以及第一型直觉模糊覆盖粗糙集模型,主要研究了它们的性质,并给出了一些新的概念和第二型直觉模糊覆盖粗糙集模型。在此基础上,提出了单值中智β-覆盖和单值中智β-邻域等概念,并建立了单值中智覆盖粗糙集模型。为了解决多属性群决策的问题,将单值中智β-覆盖和单值中智覆盖粗糙集模型推广到了多粒度的情况,建立了三类多粒度单值中智覆盖粗糙集模型。在故障信息条件下,提出了基于直觉模糊覆盖粗糙集的群决策方法和基于单值中智覆盖粗糙集的群决策方法。针对聚合釜故障诊断问题,分别建立了故障类型为:聚合釜电机出现故障、聚合釜减速机出现故障、聚合釜机封中轴故障、聚合釜组件故障和聚合釜正常运行,以及故障特征为:聚合釜减速机振动值、操作压力、拌转速和减速机温度的直觉模糊信息系统与单值中智信息系统。并将上述决策方法应用于聚合釜的故障诊断中,所提出的方法最终决策结果基本都是聚合釜电机出现故障。这与其他已有决策方法的结果一致。因此,所提出的基于聚合釜故障信息的广义模糊覆盖粗糙集的决策方法是有效的。综上所述,本文以化工过程为背景,采用理论研究与实验验证相结合的方法,进一步研究了覆盖粗糙集、模糊覆盖粗糙集和广义模糊覆盖粗糙集相关问题(覆盖约简问题、属性约简问题等)。在此基础上,分别考虑了不完备故障信息和完备故障信息两种情况,利用基于覆盖粗糙集(用于提高不完备信息故障诊断的准确率)和模糊覆盖粗糙集(用于提高完备信息故障诊断的准确率)的属性约简方法解决了故障诊断中的特征选择问题,并结合智能分类器提高了故障诊断的准确度。最后,利用所建立的广义模糊覆盖粗糙集模型,建立多属性群决策方法,将其应用于化工过程的故障诊断中,为多专家故障决策提供了一种简便的方案。这些都为化工过程的智能故障诊断方法提供了理论及技术参考。
张晓岚[2](2020)在《基于列车数据分析的故障预警技术研究》文中指出列车运行控制系统是高速列车控制系统的“神经中枢”,是铁路运输的基础设施。其中,车载子系统是列控系统的核心部分,是保证行车安全、提高运行效率的关键。列车在运行过程中受各种因素影响,车载设备故障时有发生,如今车载子系统的故障处理方式仍以维修人员的经验为主,缺乏安全趋势预测和风险评估预警等方面的研究,影响列车的行车安全及效率。因此,如何提高车载设备故障预警能力以及制定恰当的辅助维护方法,提高列车安全可靠性是铁路运营部门急需解决的问题。本文以300T型车载设备为研究对象,从系统的故障诊断、可靠性评估以及设备维护等方面开展分析,建立基于列车数据分析的车载设备故障预警系统。论文主要的研究工作与研究成果如下:(1)在故障诊断方面,本文针对车载设备文本故障数据结构复杂且冗余度高的特点,提出了一种基于文本挖掘技术的故障特征提取方法,将IDF-TF算法与粗糙集理论相结合,得出有效故障特征集。通过建立BP神经网络模型,验证该方法可剔除冗余不相关特征,简化了诊断模型,提高了诊断精度,改善了诊断模型对数据质量依赖的缺陷。该模型不同于以往基于信号的故障诊断模式,为列车的故障诊断提供了新的处理思路。(2)在可靠性评估方面,本文从设备故障危害度方面出发,提出了基于BN改进的FMECA模型,对车载设备进行客观定量的风险评估,解决了原始FMECA对预警造成的主观随意性问题;从系统功能角度出发,利用AHP方法对车载设备进行安全可靠性权重排序。最终综合考虑设备的危害度和权重,利用组合赋权法对系统进行综合预警评估,改变了传统的从单一因素评价故障的方式。(3)在设备维护方面,本文依据统计数据,对车载设备的更换趋势进行了多项式拟合预测,方便工作人员制定下一阶段的工作任务;依据设备的预警评估结果制定针对性维修策略,提高了列车安全可靠性,降低了维修成本,为高速铁路向智能化发展提供了一种由“定期修”向“视情修”转变的新的维修方案。(4)利用MATLAB与C#混合编程技术设计了车载设备安全分析预警系统的各功能模块,实现了车载设备故障诊断的智能化分析,达到故障预警的可视化管理目的。
魏苗苗[3](2020)在《面向Bug分派的数据集约简方法的研究》文中进行了进一步梳理随着软件功能及其开发过程越来越复杂,Bug仓库追踪报告的Bug数量急剧增加。传统的人工判读和分析已经无法适应大规模的Bug数据,越来越多的基于文本分类的自动Bug分派研究应运而生。大多数研究都将Bug报告中的短描述作为文本信息,再在分派模型上进行优化,忽略了可以提供更多信息但同样也会带来更多噪音的长描述。如果数据集质量不高,无论如何优化分派模型也不会达到很好的效果。另一方面,Bug数目巨大,开发人员的时间和人数有限,所以优先修复影响较大的Bug报告,可以将它们带来的损害最小化。然而,Bug报告数据集往往是不平衡的。因此,为了提高Bug仓库中Bug报告的维护和管理,减少人工成本,需要对文本描述信息中包含的噪音多及如何有效识别高影响力Bug报告作进一步研究。考虑到Bug不同其对系统造成的潜在威胁也不同,严重程度越高的Bug报告越应该优先解决。针对数据集规模大、质量低且数据不平衡的现象,本论文对其Bug分派方法进行了研究,主要贡献如下:(1)提出了一种加权优化的Bug分派方法,通过去除冗余特征和噪音样本,在保证权值和二元约束的同时最大化Bug分派的正确率,建立一个高质量的缺陷数据集。本文提出的技术建立在三种特征选择算法和四种实例选择算法的基础上,目的是在训练数据集存在噪声的情况下也能自动准确地进行Bug分派。实验结果表明,本文所提出的基于加权优化的Bug分派方法在几种情况下均能达到较好的训练精度,优化后数据集的正确率比原始训练集提高4%左右。(2)提出了一种基于启发式约简与不平衡处理的高影响力Bug报告识别方法。在数据约简阶段,我们将特征选择和实例选择与遗传算法相结合,通过删除冗余或非信息性的错误报告和词汇,构建规模小质量高的错误报告集合;在不平衡处理阶段,我们通过四种不平衡学习策略来处理错误报告的不平衡分布。实验证明,将数据约简与不平衡学习策略相结合的方法能够有效识别高影响的Bug报告。
侯文丽[4](2020)在《基于邻域粗糙集的增量属性约简算法研究》文中提出在科技时代背景下,信息技术时刻在高速率地发展着,各行各业中产生了大量的数据,据不完全统计,在互联网中每天有数万亿PB数据不断更新和增长。这不得不使得人们在收集大规模数据,以及储存处理数据的这些方面的技能迫切提升。在许多工业、教育以及医疗行业中都存在着大量多维的数据,针对于此类数据进行一定程度的数据分析,有利于人们从数据中挖掘出来隐藏在数据背后的有价值的信息,同时,也有利于预测出下一阶段数据的变化情况,这样,有利于针对于动态变化的数据提前做好应对之策。总之,数据挖掘和智能信息处理目前已经是研究工作者们近些年来重点关注的研究内容之一。粗糙集理论是用来处理模糊、不确定、不完备数据的一种有效的数学工具,它的优势在于很多时候仅仅需要利用生成的数据表中的信息本身,并不需要计算出其他的概率论的有关数学知识,如先验知识和其它附加信息等,通过简单的分析处理就可以很便利地分析数据表中的各项数据,进而发现隐藏在数据表中背后的有用的有研究意义的知识或者数据,粗糙集理论一定程度上,揭示潜在数学规律。就目前看来,粗糙集理论以及衍生出来的邻域粗糙集理论、变精度粗糙集理论、模糊粗糙集理论和覆盖粗糙集理论等理论,这些相关理论已经大量运用在数据挖掘、智能信息处理、模糊识别和知识约简等科学研究。属性约简是在保持属性区分能力不改变或者大方向不改变的情况下,去除掉数据中的无关或者不太重要的属性。近些年来,由于许多医疗、教育和工业领域中的数据通常都是在动态实时更新变化,每当数据的数据量増长到一定维度时候,从原始数据集中获取的属性约简和知识获取结果将不再适用,此时需对新生成的数据表,重新进行处理和分析。若使用静态的非增量式的属性约简方法来处理时,将导致属性约简算法的时间复杂度急剧增加,且较难寻找出新数据相较于原始数据的变化规律所在。因此,基于粗糙集理论围绕动态数据研究动态数据挖掘理论和方法具有很大的研究价值。本文的主要研究工作和创新工作如下:(1)基于邻域粗糙集模型和邻域条件熵的常规增量属性约简算法存在精度低,效率低。本文重新定义了一种新的邻域粗糙熵,并推导出邻域粗糙条件熵,分析了基于信息熵的属性约简算法相对于代数观下属性约简算法的优势,以属性的邻域粗糙条件熵为基础来计算属性重要度,提出了一种基于邻域粗糙条件熵的非增量属性约简算法,并且为了精确地确定邻域阈值,本文利用人工蜂群优化算法来搜寻本算法最优的邻域阈值。(2)针对决策表下样本的动态变化,研究探讨了如何快速地从动态决策表中提取关键的知识或规则。第一,完备决策表中独立样本的増加和删除进行分析,基于新的邻域粗糙条件熵动态更新机制,通过计算新的重要度和约简集,对于满足阈值要求的规则进行动态增加和删除。第二,再分析批增量下,多个对象增加和删除时,基于新的邻域粗糙条件熵动态更新机制,再重新确定新的约简结果。主要是分析了新增样本后邻域的变化规律,邻域粗糙条件熵的变化规律以及约简结果的变化规律,并做了详细的理论推导工作。(3)在(2)的基础上,提出了一种基于邻域粗糙集的増量式属性约简算法。在UCI标准数据集随机改变数据集中的10%,20%,30%,40%,50%样本中的数据值,重新计算新生成的数据集的约简结果,并通过与多种算法进行约简结果的对比实验和以十倍交叉验证方法在两种传统分类器下的精度分析对比实验,实验证明所提出的属性约简算法以及新定义的邻域粗糙条件熵的有效性和可行性,并证明了所提算法对混合多维数据有一定的应用价值。综上,本文以粗糙集理论作为数学理论支撑,以智能信息处理为目的,针对动态不完备决策表的属性约简和知识获取模型与增量属性约简算法进行了深入的分析和研究。针对动态数据中的样本集变化,导致的属性约简和知识获取需要实时更新问题,进行了较深入研究,设计一种新的增量属性约简算法,较好地解决了许多静态非增量算法未能描述数据更新变化的变化规律和算法运行效率较低等诸多问题,进而为更容易适应大数据环境下数据实时分析和挖掘。
吴照玉[5](2020)在《基于粗糙集模型扩展的特征选择算法研究》文中研究说明粗糙集理论是波兰学者Pawlak于二十世纪八十年代提出的一种能有效处理不完备性和不确定性的新型数学工具,并且在各个研究领域中得到了广泛的应用。但现有的经典粗糙集理论在处理不确定性数据和数值型数据方面存在缺陷,不利于噪声数据的处理和保持数值型数据内部结构的完整性。因此,为了解决上述问题,基于粗糙集模型扩展研究成为了国内外学者的研究热点。本文主要从经典粗糙集的两个拓展模型:决策理论粗糙集模型和邻域粗糙集模型进行研究,并对其相应的特征选择算法进行改进,旨在在不改变分类机制的基础上,使分类精度更精确。本文的主要研究内容如下:(1)本文针对决策理论粗糙集模型中正区域不能随属性增加而单调变化的问题。首先根据贝叶斯决策理论引入决策规则,来确定对象是否属于正区域。然后再此基础上提出新的定义,即约简集的正区域必须不低于属性全集的正区域。最后,结合启发式搜索策略提出了一种新的特征选择算法。通过对比实验分析结果得出该算法能满足正区域的最大化,具有更高的分类精度,从而提高了算法的效率。(2)虽然改进的正区域特征选择算法取得了不错的性能,但放在邻域粗糙粗糙集模型中,可能无法直接处理正区域出现的混合型数据的样本分类情况。并且邻域粗糙集模型在表征属性子集的分类能力时,同样也无法很好地描述类别混合样本的邻域。针对以上两种问题,本文后续针对邻域粗糙集模型的特点,首先分别分析了?邻域和k最近邻两者的优势,将两者进行结合提出了一种新的邻域粗糙集模型,引入了新的诱导信息粒子以及利用迭代策略计算决策上下近似。然后引入可变精度模型到改进的邻域粗糙集模型中来处理噪声数据。最后采用贪婪搜索策略,设计了一种改进的特征选择算法。通过实验结果分析表明,此算法具有更低的泛化能力,能够在不降低分类精度的前提下,有效地去除冗余属性。
李瑞[6](2020)在《软件缺陷预测中高维数据处理研究》文中提出当前软件的规模和复杂度日益增长,因此软件可靠性备受关注。在软件工程中,如果可以找出软件系统中有可能存在缺陷的模块及其分布,对软件开发者合理配置资源及提高软件质量起到重要作用。软件缺陷预测(software defect prediction,简称SDP)技术便是对软件模块中是否存在缺陷进行预测,根据历史数据以及已经发现的缺陷等软件度量数据,预测哪些模块有出错倾向。合理的预测软件缺陷可以有效地帮助测试者快速定位并弥补软件缺陷,从而达到显着减少软件开发成本和提高软件可信度的效果。目前的研究通常将缺陷预测的实现形式化为一个机器学习问题,很多机器学习技术被用于缺陷预测。然而,现有的缺陷预测方法在实际应用中还存在许多问题。例如,这些方法的性能不够稳定,在高维数据情况下(如存在大量冗余、无关的度量元),预测精度不高,而在实际应用中高维数据是很普遍的。另外,由于有缺陷类(又称“正类”)通常远少于无缺陷类(又称“负类”),即缺陷历史数据具有类别不平衡性,容易造成预测模型更倾向于负类,从而降低了正类的预测精度。由于单分类器分类能力有限,不能有效处理不平衡数据,所以,很多学者利用集成学习方法来进行缺陷预测。本文针对软件缺陷预测中的高维、类别不平衡等问题进行了系统的研究。首先,为了处理缺陷预测中的高维、不平衡数据,我们对现有的过采样方法与特征选择方法在缺陷预测中的应用效果进行了对比研究;其次,将粗糙集理论和知识粒度等概念引入到特征选择中,提出一种新的信息熵模型——调和粒度决策熵,并由此构建出一种基于调和粒度决策熵的特征选择算法FSHGE;第三,针对单一分类器分类能力有限,缺陷预测效果不好的问题,我们提出一种多模态选择性集成学习算法SERSFS,并利用SERSFS来进行缺陷预测。SERSFS算法利用前面所提出的特征选择算法FSHGE以及重抽样技术来同时对训练集的属性空间和样本空间进行扰乱,从而实现一种高效的多模态扰乱。
董杰[7](2020)在《邻域粗糙集的并行属性约简方法研究》文中进行了进一步梳理由于科学和工业领域中数据的快速增长,传统的数据挖掘算法从数据存储和计算复杂性的角度都面临着挑战。作为数据挖掘的重要预处理技术,属性约简有助于通过消除冗余和不相关的属性来减少特征空间并提高分类性能。传统求解约简的启发式算法采用单一的度量指标作为约束条件,但这一策略并不能保证约简满足多重度量指标下约束需求。并且绝大多数的约简定义是建立在考虑所有决策类基础上的,而忽视了不同决策类别所对应的度量指标在约简前后的变化情况。除此之外,在单个节点的串行计算策略下难以处理海量数据并在庞大的搜索空间中探索有效的解决方案。针对以上问题,本文将从局部多约束角度出发,基于CUDA模型设计并实现一种并行属性约简算法。主要研究内容如下:(1)局部多约束的属性约简方法研究。首先介绍传统启发式约简算法,采用单一度量指标作为约束条件,如近似质量和条件熵。接着从局部的视角出发,分别对每一个决策类别进行约简。于是提出一种面向局部多约束的属性约简策略,其目的是使得每个决策类别都能够满足多重度量指标下的约束条件。实验结果展现了该约简方法的有效性。(2)邻域粗糙集近似和条件熵并行算法研究。首先分析CPU和GPU的结构差异,并介绍CUDA编程模型。接着讨论局部多约束条件的计算步骤,设计一种计算邻域等价类和决策类的并行算法,通过CUDA划分数据集并基于Multi-GPU计算局部条件熵和邻域粗糙集的上下近似。最后,通过三种度量指标评估并行算法的性能。实验结果表明了该算法的可行性。(3)并行属性约简算法研究。首先阐述传统属性约简算法的局限性,接着分析属性约简的并行性,给出三种并行策略的时间消耗。然后通过CUDA实现一种数据与任务并行的算法,不同决策子系统通过属性重要度得到候选属性。最后,候选属性子集进一步约简得到最终结果。实验结果表明了该算法具有较好的加速比和扩展性,可以有效处理数据挖掘中的海量数据。
王虹飞[8](2020)在《资源受限下阶层式集成学习研究》文中认为集成学习是一类重要的机器学习策略。集成学习通过构造含有多个学习器的集合,以期望获得比其中任意一个个体学习器更优的算法准确度。然而,机器学习模型的训练与使用需要消耗相应的资源,包括但不限于为完成计算任务所需的存储空间、执行时间,和耗费的能量,以及其他所需的物质与人力资源。额外的存储需求和计算成本很大程度上限制了集成学习的潜在应用。有限的计算资源成为许多集成学习方法无法回避的问题,特别是当集成规模较为庞大时,训练和使用集成模型时出现的困难和瓶颈日益显现。集成约简是破解计算资源掣肘的有效途径。集成约简又被称为集成选择、集成修剪,是集成学习中一个活跃的研究领域。集成约简主要目的是从一个集成学习集合中筛选出部分模型组成一个子集合,进而舍弃原集合中剩余的未被选取的基学习器,利用该子集替代原有集合,用较少的资源开销在性能上(通常是预测准确度)达到所需要求。集成约简研究具有显着的应用价值与重要的理论意义。本研究针对资源受限下集成约简与集成学习中亟待解决的几个问题展开了研究。首先设计集成约简算法以降低集成规模,从根本上减少由数量众多的基学习器产生的计算资源开销;以此算法为基础,研究阶层式集成学习算法框架,在控制集成规模的同时提高集成模型的精度和训练速度;依托该阶层式算法框架,形成直接计算多分类任务的方法,避免多次执行二分类学习器导致过多的资源开销;最后,研究集成学习系统的硬件部署方法,同时验证为资源受限条件设计的集成约简算法与学习框架。本研究主要工作和创新点具体包括:(1)提出了一种新颖的集成约简方法。创新性的引入布尔逻辑、逻辑综合的思想与技术,先利用逻辑最小化从初始集成选取数量非常有限的个体学习器模型,再用生成的布尔函数结合这些模型,计算最终集成的整体输出。本课题从一个全新的视角探索集成学习研究,首次认识到集成约简这一重要的机器学习问题可以被系统地规划为逻辑最小化问题。实验结果表明,在确保分类预测准确率不低于Bagging算法的情况下,平均仅保留9.43%的基学习器模型,在最佳情况下能够达到大于97%的约简率,新集成规模为当前同类算法中最小。(2)提出了一种阶层式集成学习算法框架。在训练学习阶段,算法先通过随机森林算法构建一个初始集,再通过设计的划分策略将其划分为多个较小的组,在划分后以组为单位的子集成上执行基于逻辑综合的集成约简算法,从而将最初的面向大规模初始集的集成约简问题,转换为若干个针对数量十分有限的基学习器小集合的子问题,确保逻辑综合的效果与执行效率。在使用集成学习模型做推断时,先在组内运用基学习器完成分类计算,再将各组的结果集中结合作为集成整体输出。“阶层式”为集成算法提供了一种对计算资源敏感的集成规模调控机制,能够准确的对最终集成规模的上限与下限作出预判。该集成算法显着地减少了初始集规模,且在分类准确率上超过随机森林和现有集成约简算法。(3)提出了一种多类别分类问题的直接计算方法。一直以来,当分类器不具备直接处理多类别分类问题时,传统方法习惯于将多分类问题转化为一组二分类的子问题求解。本研究则从正面直接给出解决办法:先利用多位编码表示两个以上的数据样本类别,再对多位编码后的真值表执行多次逻辑综合生成布尔函数组,其中每个函数负责一个类别编码位的布尔值。实验结果验证了方法的可行性,在取得超过随机森林的分类准确率的同时能够实现更小的最终集成规模。(4)提出了一种由高级程序语言向硬件描述语言自动转化的范式,能够从基于高级程序语言的决策树集成学习模型自动生成可在硬件系统部署的电路模型。实验部分从物理层面考察了包括随机森林在内的若干集成算法对硬件资源占有情况,是本课题“资源受限下”的集成学习研究的重要实践部分。前期机器学习、数据挖掘研究不乏有设计巧妙的集成约简方法,但往往止步于算法在纯软件环境的实现和验证。虽多次指出在嵌入式及边缘设备中的应用前景,却从未实现。本研究的自动转化范式不仅在真实的物理硬件系统上验证了本课题提出的算法,还具推广意义,可以与现有的绝大多数决策树集成学习研究结合,满足机器学习模型硬件实现、软硬件系统协同设计的工业应用需求。综上所述,阶层式集成学习框架是本课题研究的核心。以此为基础的划分策略和训练方法可以有效地调控集成模型的预测准确率、存储开销、功耗、训练时间、响应速度等性能,达到资源受限下的最佳综合状态。面向多分类问题的直接计算方法使阶层式集成框架功能上更加完善。逻辑综合则是贯穿全文的关键技术。大量的软、硬件实验结果验证了本研究提出的集成算法与方法。
陈鑫影[9](2019)在《层级语义下情境适应的SWoT服务组合与选择机理》文中研究说明语义物联网是物联网内在矛盾的应对之策,它不是物联网和语义网的简单叠加,而是物联网的提升。语义互操作(语义协同)即在语义层面的信息交换和信息共享。语义物联网中的服务和其它服务并不是完全分裂的,网络中的服务加上语义标注后与物理实体设备绑定映射,就具备了语义物联网服务的特点。面对海量的、冗杂的网络数据,为在动态环境中,快速和准确地应对动态、复杂的服务需求,需要基于语义互操作对语义物联网服务的关键技术进行研究。目前,基于语义互操作的语义物联网服务的研究已经取得了一些进展,但仍然存在诸多亟待解决的关键问题,例如,如何有效解决语义关系的链接预测,如何解决服务情境规则的自动提取,如何高效而准确地获取动态服务组合等等。本文将针对这几个密切相关的热点问题,从如下三个方面进行系统性的研究。本文的主要研究成果如下。(1)为了解决语义物联网服务间的语义关系的链接预测和自动协作问题,提出了对应的解决方案,具体内容包括:1)首先,基于语义链接网络提出一种三层级语义服务结构化网络模型(SNM4SS)。SNM4SS模型能够表达丰富的语义关系并进行推理,可以实现语义物联网服务的自动协作。2)为了构建三层级语义服务结构化网络模型,基于Markov网、服务事件间的语义关系矩阵和边删除算法,分别提出基于条件互信息的语义服务事件网的构建算法(SSEN)和动态更新算法(SSENU)。3)此后,由于语义服务事件网的动态构建需要解决服务事件链接推理问题,因此,基于Markov逻辑网和随机游走策略,提出了一种服务事件链接推理算法(SELR)。SELR推理算法能降低推理运算中的节点数,避免了利用闭Markov逻辑网建模所带来的巨大时空开销问题,可以更为有效解决面向多层级语义服务结构化网络中服务事件关系的链接预测问题。最后,通过一系列的实验验证了所提出算法的有效性。(2)为了提供更为准确的语义服务,提高服务情境规则的提取效率和准确率,提出了一种语义服务的复杂自适应情境规则的提取方法,包括:1)首先,基于可分辨关系和可分辨约简,设计一个决策分辨约简算法(DecDepRed),DecDepRed算法将传统的逻辑知识粒化过程转化为矩阵计算,可完成上下文冗余属性的快速约简。2)然后,提出了基于决策依赖度的规则提取算法(DecDepRul),DecDepRul算法可以进行上下文冗余属性值的快速约简,并将约简结果自动转换为决策规则。最后,通过实验验证新方法生成的规则的简洁性和有效性。(3)为满足实时的动态的语义服务需求,高效而准确地获取动态服务组合,提出了一种语义物联网服务智能组合和选择方法。具体内容包括:1)首先,提出了基于语义匹配度和组合服务质量的模型QoS(CS)并设计了相关求解算法。QoS(CS)模型综合考虑了组合服务的子服务间的局部语义匹配,需求与服务间的全局匹配,服务的输入和输出参数间的依赖关系,以及复合服务的QoS质量模型等多方面因素。2)然后,基于QoS(CS)模型和遗传算法,提出了一种语义物联网服务智能组合与选择算法(IC&SSWTS)。通过实验发现,IC&SSWTS算法能够在较低成本和代价的前提下,提供较为合理的近似最优解。
李涛[10](2019)在《基于演化计算的特征选择方法研究》文中研究表明特征选择技术是大数据分析与数据挖掘研究的热点之一,数据维度的激增为特征选择理论和方法带来了新的困境。特征选择能有效地处理高维数据,改善学习模型的泛化能力,但是数据规模的日益膨胀以及数据类型结构的多样化严重影响学习算法对数据的分析性能。依据特征蕴含信息的重要性,原始特征可以划分为无关特征、相关特征和冗余特征,而相关特征与冗余特征相互转化的特点使得搜索最优特征子集的任务更具挑战性。本文将特征子集选择任务刻画为特征组合优化问题,采用具有良好全局搜索和并行计算特性的演化计算方法进行特征空间寻优。主要研究适用于特征组合优化的个体编码策略、演化搜索机制、优化目标构建方法以及算法性能度量指标。分别从监督式演化计算与无监督式演化计算两方面对特征选择问题进行研究分析。前者主要研究基于单目标演化和包含分类边界信息的多目标演化的特征选择算法,以及基于个体熵的二元差分演化特征选择算法。后者主要针对样本缺少标签信息指导的问题,研究基于演化计算理论的无监督特征选择及其演化聚类优化算法。本文的主要创新点和具体研究内容为:(1)提出基于粒信息遗传优化的特征选择算法。构建基于粒信息的特征选择框架,通过粒化分析特征所包含的分类信息量以评价特征子集的优劣,从信息粒化的角度分别设计基于新型二进制遗传算法的特征粒化算子和基于粒度?邻域粗糙模型的样本粒化算子。特征粒化方面,设计基于粒化的机制评估候选特征子集,使得特征粒化算法选择出重要的特征;样本粒化方面,根据邻域半径先验知识划分不同的粒度层,并计算特定粒度层下的决策属性对条件属性的依赖度,从而获得良好的特征子集。为进一步研究分析粒度参数对候选特征子集选择的影响,又给出基于遗传算法的粒度优化算法,其主要目的是以自适应的方式选择合理的粒度值,使得获得的特征子集达到最优。通过实验结果以及应用实例表明,所提方法能显着改善特征子集的分类准确度。(2)提出基于改进多目标优化的混合特征选择算法。针对单目标特征选择算法选择出特征子集的综合性能较差的问题,本文分析多个优化目标的冲突关系,继续研究邻域模型中分类边界信息对特征重要度量的影响,引入新的邻域模型来计算正域值,该方法将边界区域蕴含的分类信息融入正区域中,使得选择的特征子集尽量包含相关特征。在此基础上,将特征子集规模与分类错误率作为两个优化目标综合评估候选特征子集的质量,同时设计相应的二进制编码策略,并将优化目标嵌入个体编码中以实时监控个体质量,利用个体非支配算子来获得Pareto解集。与此同时,计算候选个体之间的拥挤距离以增强演化进程中种群的多样性。给出特征核集的概念,研究Pareto前沿中不同候选特征子集的交叉信息,并基于此来计算最优的Pareto解。由实验结果分析表明,该方法能有效平衡相关特征数目和分类准确度的性能,获得良好的折中解。(3)提出基于个体熵的二元差分演化特征选择优化算法。为研究分析演化过程中多样性与收敛性对特征子集寻优的影响,提出一种高效的二元差分演化算法。首先定义个体熵,分析和量化个体熵与种群多样性的关系,并将个体熵融入优化目标函数,监督特征空间搜索过程中种群多样性的变化,然后给出一种基于局部反向学习的初始化策略,以避免因种群随机性造成的不收敛或早熟问题;设计能满足闭合条件的离散变异算子,根据不同的演化阶段采用相应的子操作,保证演化算法种群的多样性与收敛性。同时设计基于个体熵的自适应二元交叉算子,使得交叉因子依据个体适应度反馈自行调节,减少主观因素对演化过程的负作用。通过实验结果分析显示,所提方法在保证良好的分类性能和特征子集规模情况下,明显压缩了演化算法的时间成本。(4)提出基于差分演化的无监督特征选择及其聚类优化算法。针对缺乏标签信息指导特征子集搜索的问题,引入流形学习模型,构建新型的拉普拉斯计算方法来刻画数据集的内部结构,保留原始样本之间近邻或远离的关系,依据拉普拉斯值度量所选特征具有的局部保留能力,提出基于离散型差分演化的无监督特征选择优化算法,并给出新的个体变异算子和个体交叉算子,以获得优化的特征子集;为了验证选择的特征子集的质量,继而提出基于连续型差分演化的聚类优化算法,设计基于模式的编码策略来表征种群中的个体,并将样本间的紧密度与稀疏度作为聚类的优化目标,采用聚类精度、标准互信息和调整兰德指数三个指标来分析聚类结果。与现有基于稀疏学习的无监督特征算法对比可知,该方法可以有效地选择出能保留数据内部流形结构的关键特征,改善聚类效果。
二、A potential reduction algorithm for an extended SDP problem(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、A potential reduction algorithm for an extended SDP problem(论文提纲范文)
(1)覆盖粗糙集与模糊粗糙集及其在化工过程故障诊断中的应用(论文提纲范文)
摘要 |
ABSTRACT |
符号说明 |
1 绪论 |
1.1 研究背景 |
1.2 研究现状分析 |
1.2.1 化工过程故障诊断 |
1.2.2 基于数据的化工过程故障诊断 |
1.2.3 粗糙集理论及属性约简 |
1.2.4 (模糊)覆盖粗糙集及其在故障诊断中应用 |
1.3 主要研究内容与组织结构 |
2 覆盖粗糙集最大、最小描述若干问题研究 |
2.1 引言 |
2.2 覆盖粗糙集理论预备知识 |
2.3 基于矩阵的最小、最大描述计算方法 |
2.4 基于最小、最大描述的覆盖近似空间约简方法 |
2.5 基于最小、最大描述的覆盖信息系统约简方法 |
2.5.1 基于最小描述的覆盖信息系统约简方法 |
2.5.2 基于最大描述的覆盖信息系统约简方法 |
2.6 本章小结 |
3 覆盖粗糙集的故障诊断方法及其在化工汽轮机组故障诊断中的应用 |
3.1 引言 |
3.2 预备知识 |
3.2.1 化工汽轮机组及常见故障类型 |
3.2.2 不完备决策表与极大相容块 |
3.3 极大相容块的矩阵计算方法 |
3.3.1 基于最大描述的极大相容块计算方法 |
3.3.2 基于容差类的极大相容块的矩阵计算方法 |
3.4 基于极大相容块的不完备信息系统属性约简方法 |
3.5 基于“极大相容块+智能分类器”的不完备信息故障诊断方法 |
3.6 不完备信息下化工汽轮机组的故障诊断应用 |
3.6.1 化工汽轮机组故障不完备决策信息系统 |
3.6.2 决策信息表预处理 |
3.6.3 化工汽轮机组的“极大相容块+智能分类器”故障诊断模型建立 |
3.6.4 化工汽轮机组故障样本诊断 |
3.7 本章小结 |
4 基于β-覆盖的模糊覆盖粗糙集 |
4.1 引言 |
4.2 预备知识 |
4.3 模糊β-覆盖近似空间中概念之间的关系 |
4.3.1 模糊β-最小描述与各类约简之间的关系 |
4.3.2 模糊β-最大描述与β-核、I-约简之间的关系 |
4.4 模糊β-覆盖近似空间之间的关系 |
4.4.1 生成的模糊β-覆盖近似空间 |
4.4.2 I-生成的模糊β-覆盖近似空间 |
4.5 七个诱导的模糊β-覆盖近似空间和相应的格结构 |
4.5.1 七个诱导的模糊β-覆盖的一些新的性质 |
4.5.2 一些导出模糊β-覆盖的格结构 |
4.6 本章小结 |
5 模糊覆盖粗糙集的故障诊断方法及其在TE化工过程故障诊断中的应用 |
5.1 引言 |
5.2 TE化工过程 |
5.3 基于模糊β-邻域的模糊覆盖信息系统属性约简方法 |
5.4 “模糊覆盖粗糙集+智能分类器”的故障诊断方法 |
5.5 基于“模糊覆盖粗糙集+SVM”的TE化工过程故障诊断实验 |
5.5.1 获取并初始化数据 |
5.5.2 基于模糊β-邻域的TE化工过程故障数据集的属性约简 |
5.5.3 基于TE化工过程的“模糊覆盖粗糙集+SVM”故障诊断模型建立 |
5.5.4 基于TE化工过程的“模糊覆盖粗糙集+SVM”故障诊断 |
5.6 本章小结 |
6 广义模糊覆盖粗糙集 |
6.1 引言 |
6.2 预备知识 |
6.2.1 直觉模糊集 |
6.2.2 单值中智集 |
6.3 两类直觉模糊覆盖粗糙集模型 |
6.3.1 直觉模糊β-邻域、直觉模糊β-邻域系统和β-邻域 |
6.3.2 两类直觉模糊覆盖粗糙集模型 |
6.3.3 直觉模糊覆盖粗糙集模型和其他粗糙集模型之间的关系 |
6.4 单值中智覆盖粗糙集模型 |
6.4.1 单值中智覆盖近似空间 |
6.4.2 三类单值中智覆盖粗糙集模型 |
6.5 多粒度单值中智覆盖粗糙集模型 |
6.5.1 多粒度单值中智β-覆盖近似空间 |
6.5.2 三类多粒度单值中智覆盖粗糙集模型 |
6.5.3 不同中智β-覆盖产生相同的多粒度单值中智覆盖近似算子的条件 |
6.6 本章小结 |
7 广义模糊粗糙集的决策方法及其在聚合釜故障诊断中的应用 |
7.1 引言 |
7.2 聚合釜反应过程与常见故障 |
7.3 基于直觉模糊覆盖粗糙集的群决策方法及其在故障诊断中的应用 |
7.3.1 乐观多粒度直觉模糊覆盖粗糙集模型 |
7.3.2 基于直觉模糊故障信息的多属性群决策问题 |
7.3.3 基于乐观多粒度直觉模糊覆盖粗糙集的故障信息群决策方法 |
7.3.4 直觉模糊决策方法在聚合釜故障诊断中的应用 |
7.4 基于多粒度单值中智覆盖粗糙集的群决策方法及故障诊断应用 |
7.4.1 基于单值中智故障信息的多属性群决策问题 |
7.4.2 基于多粒度单值中智覆盖粗糙集的故障信息群决策方法 |
7.4.3 单值中智决策方法在聚合釜故障诊断中的应用 |
7.4.4 对比分析 |
7.5 本章小结 |
8 总结与展望 |
8.1 全文工作总结 |
8.2 研究工作创新点 |
8.3 未来工作展望 |
致谢 |
参考文献 |
附录A: 最小、最大描述的集合计算Matlab程序(第二章) |
附录B: 最小、最大描述的矩阵计算Matlab程序(第二章) |
附录C: 本文应用的化工汽轮机组故障诊断数据(第三章) |
附录D: 基于不可分辨矩阵的不完备信息属性约简Matlab程序(第三章) |
附录E: SVM故障诊断Matlab程序(第三章) |
附录F: 基于模糊β-邻域的约简计算Matlab程序(第五章) |
附录G: TE化工过程部分数据(第五章) |
附录H: 单值中智覆盖粗糙集上、下近似计算Matlab程序(第七章) |
攻读博士学位期间发表的科研成果目录 |
(2)基于列车数据分析的故障预警技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 特征提取技术研究现状 |
1.2.2 故障诊断技术研究现状 |
1.2.3 安全可靠性方法研究现状 |
1.3 论文主要内容及结构安排 |
第二章 故障预警关键技术分析 |
2.1 车载设备结构及功能 |
2.2 故障文本数据介绍 |
2.3 故障诊断方法分析 |
2.3.1 文本挖掘技术分析 |
2.3.2 故障诊断模型分析 |
2.4 安全可靠性方法分析 |
2.4.1 可靠性数据分析 |
2.4.2 故障树与贝叶斯基本原理 |
2.4.3 故障模式影响及危害性方法分析 |
2.4.4 系统综合评估方法研究 |
本章小结 |
第三章 文本故障诊断模型的建立与仿真 |
3.1 故障数据特征提取 |
3.1.1 基于TF-IDF的故障特征提取 |
3.1.2 故障特征的属性约简 |
3.1.3 不平衡数据的特征提取方法 |
3.2 模型建立与仿真 |
3.2.1 BP神经网络模型 |
3.2.2 模型仿真 |
本章小结 |
第四章 列控车载子系统可靠性分析与评估 |
4.1 基于贝叶斯网络的车载子系统可靠性分析 |
4.1.1 系统故障致因模型 |
4.1.2 FTA向BN的转化 |
4.1.3 系统薄弱环节分析 |
4.2 基于FMECA的车载子系统可靠性分析 |
4.2.1 系统风险分析模型 |
4.2.2 改进系统风险评估 |
4.3 基于AHP的基本单元权重确立 |
4.3.1 层次分析法模型 |
4.3.2 基本单元权重确立 |
4.4 车载系统故障预警综合分析 |
4.4.1 设备故障预测 |
4.4.2 综合预警评估 |
4.4.3 维修策略分析 |
本章小结 |
第五章 车载设备安全分析预警系统 |
5.1 系统软件方案与功能设计 |
5.1.1 系统设计原则 |
5.1.2 软件功能设计 |
5.2 故障预警系统功能实现 |
5.2.1 系统管理模块 |
5.2.2 系统主界面 |
5.2.3 故障数据查询界面 |
5.2.4 故障诊断模块 |
5.2.5 系统预警模块 |
本章小结 |
结论 |
参考文献 |
附录 系统软件部分设计类图 |
攻读硕士学位期间发表的学术论文 |
致谢 |
(3)面向Bug分派的数据集约简方法的研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景和意义 |
1.1.1 Bug分派 |
1.1.2 高影响力Bug识别 |
1.2 当前研究存在的问题 |
1.3 本文主要研究内容 |
1.4 论文组织结构 |
2 Bug分派及高影响力Bug识别研究概述 |
2.1 Bug分派处理技术国内外研究现状 |
2.2 高影响力Bug报告识别国内外研究现状 |
2.3 相关算法概述 |
2.3.1 特征选择算法 |
2.3.2 实例选择算法 |
2.3.3 不平衡学习策略 |
2.4 本章小结 |
3 基于数据集加权优化及约简的Bug分派 |
3.1 引言 |
3.2 组合约简算法 |
3.3 Bug分派模型 |
3.3.1 模型介绍 |
3.3.2 加权优化方法 |
3.4 实验设计 |
3.4.1 实验数据集 |
3.4.2 实验环境及设置 |
3.4.3 评价标准 |
3.5 实验结果 |
3.5.1 实验一: 验证不同分类器对预测结果是否有影响 |
3.5.2 实验二: 验证使用不同约简算法在加权与不加权的数据集上的分类表现 |
3.5.3 实验三: 验证属性实例组合约简的不同顺序对预测正确率是否有影响 |
3.6 本章小结 |
4 基于启发式约简与不平衡处理的高影响力Bug报告识别 |
4.1 引言 |
4.2 遗传算法 |
4.3 高影响力Bug报告识别模型 |
4.3.1 模型介绍 |
4.3.2 启发式特征及实例约简算法 |
4.3.3 适应度函数设计 |
4.4 实验设计 |
4.4.1 实验数据集 |
4.4.2 实验设置 |
4.4.3 评价标准 |
4.5 实验结果 |
4.5.1 实验一: 验证用启发式方法对数据集进行特征及实例约简的效果并与基础约简方法进行对比 |
4.5.2 实验二: 验证使用启发式方法对数据集特征选择与实例选择的顺序对实验结果的影响 |
4.5.3 实验三: 验证不平衡处理与用启发式方法对数据集进行约简的顺序对识别高影响力Bug报告的影响 |
4.6 本章小结 |
结论 |
参考文献 |
致谢 |
作者简历及攻读硕士学位期间的科研成果 |
(4)基于邻域粗糙集的增量属性约简算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题应用背景及选题意义 |
1.1.1 课题应用背景 |
1.1.2 选题意义 |
1.2 论文国内外研究现状 |
1.2.1 粗糙集理论的研究现状 |
1.2.2 粗糙集理论在不完备信息系统中的研究现状 |
1.3 论文研究内容 |
1.4 论文的结构组成以及安排 |
第二章 理论综述 |
2.1 粗糙集理论的基本理论 |
2.2 邻域粗糙集的基本理论 |
2.3 属性约简 |
2.4 动态数据的约简方法 |
2.5 本章小结 |
第三章 基于邻域粗糙条件熵的非增量属性约简算法 |
3.1 邻域粗糙条件熵的相关理论 |
3.1.1 邻域粗糙熵的定义 |
3.1.2 邻域粗糙条件熵的定义 |
3.2 基于邻域粗糙条件熵属性约简算法 |
3.2.1 基于信息熵的属性约简算法的优势 |
3.2.2 算法设计 |
3.3 算法测试和结果分析 |
3.3.1 参数的确定 |
3.3.2 算法测试和结果分析 |
3.3.3 非增量属性约简算法的应用场景 |
3.4 本章小结 |
第四章 基于邻域粗糙条件熵的增量属性约简算法 |
4.1 增量式约简机制 |
4.1.1 增加样本后邻域的变化规律 |
4.1.2 增加样本后新的邻域粗糙条件熵的变化规律 |
4.1.3 增加样本后约简结果的变化规律 |
4.2 基于邻域粗糙条件熵的增量属性约简算法的设计 |
4.3 增量属性约简算法的测试和结果分析 |
4.3.1 实验环境 |
4.3.2 约简时间对比分析 |
4.3.3 精度对比分析 |
4.3.4 增量属性约简算法的应用场景 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读学位期间取得的科研成果 |
致谢 |
(5)基于粗糙集模型扩展的特征选择算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 粗糙集理论研究现状 |
1.2.2 决策理论粗糙集研究现状 |
1.2.3 邻域粗糙集研究现状 |
1.2.4 特征选择研究现状 |
1.3 论文的研究内容和组织结构 |
1.3.1 本文的主要研究内容 |
1.3.2 章节安排 |
第二章 粗糙集理论基础 |
2.1 粗糙集概述 |
2.2 知识表达系统 |
2.3 不可分辨关系 |
2.4 集合的上下近似 |
2.5 粗糙度 |
2.6 依赖度 |
2.7 属性重要度 |
2.8 本章小结 |
第三章 粗糙集模型扩展研究 |
3.1 决策理论粗糙集模型 |
3.1.1 决策理论粗糙集的引入 |
3.1.2 基本理论 |
3.1.3 问题处理 |
3.2 邻域粗糙集模型 |
3.2.1 邻域粗糙集模型的引入 |
3.2.2 基本概念 |
3.2.3 问题处理 |
3.3 实域粗糙集模型 |
3.3.1 实域粗糙集模型的引入 |
3.3.2 基本概念 |
3.3.3 问题处理 |
3.4 本章小结 |
第四章 决策理论粗糙集模型特征选择算法研究 |
4.1 基于决策理论粗糙集模型的基本理论与缺点分析 |
4.1.1 决策理论粗糙集模型的基本理论 |
4.1.2 决策理论粗糙集缺点分析 |
4.2 改进的正区域特征选择算法 |
4.3 实验分析 |
4.3.1 实验环境 |
4.3.2 实验数据集 |
4.3.3 实验结果分析 |
4.4 本章小结 |
第五章 邻域粗糙集模型下的特征选择算法研究 |
5.1 基于邻域粗糙集模型的基本概念与缺点分析 |
5.1.1 邻域粗糙集模型有关的基本概念 |
5.1.2 邻域粗糙集缺点分析 |
5.2 基于邻域粗糙集模型改进与算法研究 |
5.2.1 改进的邻域粗糙集模型 |
5.2.2 特征选择算法研究 |
5.3 实验分析 |
5.3.1 实验环境 |
5.3.2 实验数据集 |
5.3.3 实验结果分析 |
5.4 本章小结 |
总结与展望 |
参考文献 |
攻读硕士学位期间发表的学术论文 |
致谢 |
(6)软件缺陷预测中高维数据处理研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 选题背景和研究意义 |
1.2 国内外研究现状及分析 |
1.2.1 特征选择方法研究现状 |
1.2.2 软件缺陷预测中特征选择研究现状 |
1.2.3 软件缺陷预测中不平衡数据处理研究现状 |
1.3 本文主要贡献 |
1.4 本文组织结构 |
2 相关理论概述 |
2.1 软件缺陷预测概述 |
2.1.1 问题定义及过程 |
2.1.1.1 软件缺陷 |
2.1.1.2 软件缺陷预测 |
2.1.2 软件缺陷预测技术 |
2.1.2.1 常用机器学习算法 |
2.1.2.2 基于机器学习技术的缺陷预测研究进展 |
2.2 不平衡数据处理方法概述 |
2.2.1 欠采样方法 |
2.2.2 过采样方法 |
2.2.2.1 随机过采样方法(Random Over Sampler) |
2.2.2.2 合成少数类过采样技术(SMOTE) |
2.2.3 混合采样方法 |
2.3 高维数据处理方法理论概述 |
2.3.1 特征选择的定义及选择过程 |
2.3.2 基于粗糙集的特征选择方法 |
2.4 本章小结 |
3 过采样与特征选择方法在软件缺陷预测中的对比研究 |
3.1 引言 |
3.2 经典的过采样方法 |
3.2.1 Borderline-SMOTE |
3.2.2 自适应综合过采样(ADASYN) |
3.3 经典的特征选择方法 |
3.3.1 方差阈值(Variance Threshold) |
3.3.2 卡方检验(Chi-square test) |
3.3.3 递归式特征消除(recursive feature elimination) |
3.3.4 L1正则化(L1 regularization) |
3.4 过采样方法与特征选择方法在软件缺陷预测中的组合应用 |
3.4.1 实验数据 |
3.4.2 评价指标 |
3.4.2.1 混淆矩阵 |
3.4.2.2 F1-measure |
3.4.2.3 AUC |
3.4.3 实验结果与分析 |
3.4.3.1 实验设置 |
3.4.3.2 实验结果 |
3.5 本章小结 |
4 基于调和粒度决策熵的特征选择研究 |
4.1 引言 |
4.2 调和粒度决策熵 |
4.3 基于调和粒度决策熵的特征选择算法FSHGE |
4.4 本章小结 |
5 基于重抽样与特征选择的多模态选择性集成学习算法及其在缺陷预测中的应用 |
5.1 前言 |
5.2 基于重抽样与特征选择的多模态选择性集成算法SE_RSFS |
5.3 SE_RSFS算法在软件缺陷预测中的应用 |
5.4 实验 |
5.4.1 实验准备 |
5.4.2 实验结果与分析 |
5.4.2.1 实验设置 |
5.4.2.2 实验结果 |
5.5 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
致谢 |
攻读硕士期间发表的学术论文 |
(7)邻域粗糙集的并行属性约简方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 粗糙集理论的研究现状 |
1.2.2 属性约简的研究现状 |
1.3 研究内容和组织结构 |
第2章 粗糙集理论概述 |
2.1 经典粗糙集的基础知识 |
2.1.1 等价关系与等价类 |
2.1.2 上近似与下近似 |
2.1.3 知识约简 |
2.2 邻域粗糙集的基础知识 |
2.2.1 邻域粒化 |
2.2.2 邻域粗糙集逼近 |
2.3 本章小结 |
第3章 局部多约束的属性约简算法 |
3.1 传统近似质量约简 |
3.2 局部近似质量约简 |
3.3 局部多约束属性约简 |
3.4 实验结果与分析 |
3.5 本章小结 |
第4章 邻域粗糙集近似和条件熵并行算法 |
4.1 GPU和 CUDA |
4.1.1 硬件结构 |
4.1.2 并行控制 |
4.2 并行计算邻域粗糙集近似和条件熵 |
4.3 实验结果与分析 |
4.4 本章小结 |
第5章 并行属性约简算法 |
5.1 传统属性约简算法的局限性 |
5.2 属性约简算法的并行性 |
5.2.1 正区域算法与信息熵算法的并行性 |
5.2.2 属性约简的并行化策略 |
5.3 基于CUDA的并行属性约简算法 |
5.4 实验结果与分析 |
5.5 本章小结 |
结论与展望 |
参考文献 |
攻读硕士学位期间发表的论文情况 |
致谢 |
(8)资源受限下阶层式集成学习研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 研究目标 |
1.3 论文组织结构与贡献 |
2 基于逻辑综合的集成约简算法 |
2.1 集成学习与集成约简 |
2.2 逻辑综合与优化 |
2.3 集成约简算法 |
2.4 实验结果与分析 |
2.5 本章小结 |
3 阶层式集成约简与学习算法 |
3.1 引言 |
3.2 阶层式集成算法设计 |
3.3 初始集划分策略 |
3.4 集成算法实验与分析 |
3.5 本章小结 |
4 基于布尔逻辑的多类别分类方法 |
4.1 多类别分类问题 |
4.2 布尔逻辑与多类别分类 |
4.3 实验与分析 |
4.4 本章小结 |
5 集成学习模型的硬件实现 |
5.1 研究背景及本章目标 |
5.2 硬件模型自动生成方法 |
5.3 实验与分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 全文总结 |
6.2 研究展望 |
致谢 |
参考文献 |
附录1 攻读博士学位期间发表论文目录 |
(9)层级语义下情境适应的SWoT服务组合与选择机理(论文提纲范文)
创新点摘要 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景和研究意义 |
1.2 相关工作的国内外研究现状 |
1.2.1 语义信息组织模型和语义信息系统模型 |
1.2.2 服务情境决策规则自动生成方法的相关研究 |
1.2.3 基于语义的服务组合和选择方法的相关研究 |
1.3 主要研究内容 |
1.4 论文的组织与结构 |
2 语义物联网的三层级语义服务结构化网络 |
2.1 理论基础 |
2.1.1 语义物联网服务的四面体层次体系结构 |
2.1.2 语义物联网的适应性支撑框架 |
2.1.3 Markov网络 |
2.1.4 Markov逻辑网络 |
2.2 语义物联网的三层级语义服务结构化网络 |
2.2.1 感知元层 |
2.2.2 语义对象层 |
2.2.3 语义服务事件层 |
2.3 基于Markov网的语义服务结构化网络的构建 |
2.3.1 语义服务事件的Markov网 |
2.3.2 结构化网络模型的构建与更新算法 |
2.4 基于Markov逻辑网络的语义服务关系推理 |
2.4.1 服务事件链接推理算法策略分析 |
2.4.2 服务事件链接推理算法 |
2.5 实验 |
2.6 本章小结 |
3 语义服务的复杂自适应情境规则模式 |
3.1 相关理论基础 |
3.1.1 不可区分关系 |
3.1.2 可分辨关系 |
3.2 基于决策依赖度的约简处理 |
3.2.1 决策信息系统等价类划分方法 |
3.2.2 基于可分辨关系的依赖度的求解 |
3.2.3 决策信息系统求核算法 |
3.2.4 决策信息系统基于决策依赖度的约简模型 |
3.3 基于决策依赖度的规则提取 |
3.3.1 决策信息系统的属性值约简 |
3.3.2 求解重复对象集和冲突对象集的算法 |
3.3.3 冗余规则的处理算法 |
3.3.4 基于决策依赖度的规则提取模型 |
3.4 实验 |
3.4.1 基于决策依赖度的约简模型的性能分析 |
3.4.2 基于决策依赖度的规则提取模型的性能分析 |
3.5 本章小结 |
4 语义物联网服务智能组合与选择方法 |
4.1 相关定义 |
4.2 语义概念相似度的求解 |
4.3 服务二分图的最佳语义匹配的求解 |
4.4 基于语义匹配度和组合服务质量的Qos模型的求解 |
4.5 语义物联网服务智能组合与选择算法 |
4.6 实验 |
4.7 本章小结 |
5 结论与展望 |
5.1 论文总结 |
5.2 研究展望 |
附表 |
参考文献 |
作者简历及攻读博士学位期间的科研成果 |
致谢 |
(10)基于演化计算的特征选择方法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 论文的选题背景及意义 |
1.2 特征选择 |
1.2.1 特征关系概述 |
1.2.2 特征选择的基本框架 |
1.2.3 特征选择方法的类型 |
1.3 智能优化 |
1.3.1 演化计算思想 |
1.3.2 经典的演化算法 |
1.4 国内外研究现状 |
1.4.1 基于确定性搜索策略的特征选择 |
1.4.2 基于随机性搜索策略的特征选择 |
1.4.3 特征子集的度量方法 |
1.5 研究中存在的若干问题 |
1.6 本文主要研究内容及组织结构 |
1.6.1 本文主要内容 |
1.6.2 本文组织结构 |
第2章 粒信息遗传优化的特征选择算法 |
2.1 引言 |
2.2 相关研究基础 |
2.2.1 遗传算法原理 |
2.2.2 知识粒度概念 |
2.3 特征粒化算子 |
2.3.1 融合特征粒的编码机制 |
2.3.2 染色体度量函数设计 |
2.4 样本粒化及粒度优化算子 |
2.4.1 构建邻域样本粒度空间 |
2.4.2 粒度参数的优化 |
2.5 实验设计及结果分析 |
2.5.1 实验数据集及参数设置 |
2.5.2 IBGAFG算法与INRSG算法的表现 |
2.5.3 ROGA算法的表现 |
2.5.4 ROGA应用于企业财务预测 |
2.6 本章小结 |
第3章 改进多目标优化的混合特征选择算法 |
3.1 引言 |
3.2 相关研究基础 |
3.2.1 邻域决策模型 |
3.2.2 多目标优化理论 |
3.3 改进邻域正域的特征重要性度量 |
3.3.1 特征粒层构造 |
3.3.2 新的邻域正域 |
3.4 基于Pareto关系的多目标特征选择 |
3.4.1 个体编码策略 |
3.4.2 优化目标设计 |
3.4.3 非支配排序算子 |
3.4.4 个体拥挤算子 |
3.4.5 MONPR算法描述 |
3.5 MONPR的实验设计及结果分析 |
3.5.1 数据集及参数设置 |
3.5.2 Pareto前沿的比较与分析 |
3.5.3 MONPR收敛性与分析 |
3.5.4 MONPR的特征核集 |
3.5.5 MONPR的性能表现 |
3.6 本章小结 |
第4章 基于个体熵的二元差分演化特征选择算法 |
4.1 引言 |
4.2 相关研究基础 |
4.2.1 最小化优化模型 |
4.2.2 DE的改进策略分析 |
4.3 基于个体熵的二元差分演化算法 |
4.3.1 个体熵概念 |
4.3.2 种群初始化策略 |
4.3.3 个体评价函数设计 |
4.3.4 二元变异算子 |
4.3.5 自适应交叉算子 |
4.3.6 个体选择策略 |
4.3.7 BDIE算法描述 |
4.4 BDIE的实验设计及结果分析 |
4.4.1 数据集及参数设置 |
4.4.2 BDIE的适应度曲线 |
4.4.3 BDIE的分类表现 |
4.4.4 BDIE的维度约简 |
4.4.5 BDIE的运行时间 |
4.5 本章小结 |
第5章 面向无监督特征选择的差分演化及聚类优化算法 |
5.1 引言 |
5.2 无监督特征选择的挑战 |
5.3 相关研究基础 |
5.3.1 DE形式化表述 |
5.3.2 聚类分析 |
5.4 离散型差分演化的无监督特征选择 |
5.4.1 特征子空间的个体表示 |
5.4.2 改进的个体度量函数 |
5.4.3 差分演化的改进策略 |
5.4.4 提出的UFDDE算法 |
5.5 连续型差分演化的聚类优化 |
5.5.1 采用基于模式的个体编码 |
5.5.2 设计聚类的评估函数 |
5.6 UFSCDE的实验设计及分析 |
5.6.1 数据集及参数设置 |
5.6.2 聚类评价指标 |
5.6.3 实验对比算法概述 |
5.6.4 UFSCDE的性能表现 |
5.7 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
四、A potential reduction algorithm for an extended SDP problem(论文参考文献)
- [1]覆盖粗糙集与模糊粗糙集及其在化工过程故障诊断中的应用[D]. 王敬前. 陕西科技大学, 2021(01)
- [2]基于列车数据分析的故障预警技术研究[D]. 张晓岚. 大连交通大学, 2020(06)
- [3]面向Bug分派的数据集约简方法的研究[D]. 魏苗苗. 大连海事大学, 2020(01)
- [4]基于邻域粗糙集的增量属性约简算法研究[D]. 侯文丽. 太原理工大学, 2020(07)
- [5]基于粗糙集模型扩展的特征选择算法研究[D]. 吴照玉. 安徽大学, 2020(07)
- [6]软件缺陷预测中高维数据处理研究[D]. 李瑞. 青岛科技大学, 2020(01)
- [7]邻域粗糙集的并行属性约简方法研究[D]. 董杰. 江苏科技大学, 2020(03)
- [8]资源受限下阶层式集成学习研究[D]. 王虹飞. 华中科技大学, 2020
- [9]层级语义下情境适应的SWoT服务组合与选择机理[D]. 陈鑫影. 大连海事大学, 2019(07)
- [10]基于演化计算的特征选择方法研究[D]. 李涛. 哈尔滨工程大学, 2019(04)