一、浅谈数据仓库技术(论文文献综述)
吴纪龙[1](2021)在《中医药大数据资源数据仓库构建及处方分析应用研究》文中研究表明中医药学凝聚着深邃的哲学智慧和中华民族几千年的健康养生理念,在长期的临床诊疗实践中积累了丰富且宝贵的资源,这些资源种类繁多、数据量巨大并广泛分布于整个中医药领域,如何充分整合、利用及管理这些数据资源是中医药面临的难题。中药处方是中医药学理、法、方、药的重要组成部分,是在辨证论治的基础上选药配伍形成,基于大规模临床数据,发现治疗疾病的有效核心处方和潜在药物配伍可有效辅助临床决策支持。但当前仍然较多的采用传统方法对中医药数据进行存储和计算,这种方式扩展性不高且容易达到瓶颈。针对该问题,本文将有效结合大数据技术、机器学习及复杂网络等算法,对海量临床数据进行分布式挖掘,本文主要包括以下内容:(1)基于CDH(Cloudera’s Distribution Including Apache Hadoop)大数据平台,完成了对中医药大数据资源数据仓库的构建。首先,提出了一种自上而下和自下而上相结合的体系结构,使数据仓库的逻辑结构更加的清晰。同时,将多源数据采集到HDFS,分析其数据特点和相互之间的联系,设计了主题域模型和多维数据模型。然后,采用Spark、Hive QL等技术开发了ETL任务并通过Dolphin Scheduler配置了ETL工作流,完成了多源数据到数据仓库的映射,当前数据仓库包含的记录条数近3.4亿条,数据量约351GB。最后,采用Kylin针对方药主题构建了数据立方体,进行了多维OLAP分析示范研究。该数据仓库具有多源数据整合及数据处理等功能,具备Web多维分析和数据挖掘功能。(2)基于中医药大数据资源数据仓库,完成了对中医临床有效处方的分布式挖掘工作。首先,从数据仓库中抽取出慢阻肺病患者的临床诊疗数据形成数据集市。然后,根绝患者的治疗情况分为有效组和无效组,采用倾向性评分匹配方法消除两组间的混杂偏倚,针对有效组人群,提取其处方信息构建药物配伍网络并通过多尺度骨干网络算法提取核心药物子网,通过药物富集分析方法进行有效处方(P<0.05)发现,发现了165个有效处方,其有效比达到了80.88%,可作为治疗慢阻肺病的核心处方。最后,通过条件互信息法挖掘出有效药症知识。(3)开展了中药方剂配伍规律的分布式挖掘研究。为高效挖掘中药方剂中的关联规则,本文提出了一种分布式Charm算法,该算法基于Spark框架下,有效解决了传统方法挖掘效率低及内存溢出的问题。针对关联规则数量较多的问题,本文提出了一种分布式压缩算法,得到了更少的且更具代表性的关联规则,实验表明,得到的关联规则在临床上具有非常好的指导意义。
李英楠[2](2020)在《基于Hive的购销数据仓库系统的设计与实现》文中研究说明科学技术的发展带来了人们生活办公方式的转变,当今时代所倡导的人工智能,大数据等技术的发展都以数据作为基石。数据的价值在生活的方方面面都日益明显,而对于一个企业来说数据的价值更是在一个企业当中扮演着至关重要的角色,企业在日常经营与生产中积累了海量的数据,数据进入了DT时代,如何合理地处理和利用这些数据成了所有企业所关心的重要问题。大数据技术在这种背景下孕育而生,并在潮流之中稳步向前发展,在大数据的浪潮之中,Hadoop技术脱颖而出,并得到了学术界和工业界的广泛认可,Hadoop集群之上的开源数据仓库应用Hive具有模式自由、扩展性高和容错性高等特点,能够很好的为企业级数据仓库的建设提供服务,因此,越来越多的企业开始考虑如何很好地利用Hive数据仓库带来的优势,创建自己企业的数据仓库,使自身的信息化建设迈上一个新的台阶。数据仓库是一个面向主题,经过加工和集成,相对稳定并且随时间变化的数据集合,然而传统数据仓库扩展性、容错性等较低,处理大规模数据效果非常差劲,使数据仓库完全脱离了时代的潮流,发挥不出应有的功能。在数据仓库中,查询是其所有操作的重要组成部分,数据仓库中的数据会长期存在,方便用户直接进行查询操作。大数据背景下,新的数据仓库建设方案迫在眉睫。针对上面所提出的问题本文提出了一种大数据时代下新的数据仓库建设思路,更好的服务于当今社会背景下的企业的信息化建设。企业数据仓库为企业提供数据支持,方便企业更好地进行数据管理和数据挖掘工作,是企业信息化建设的核心所在。文章以数据仓库建设的背景和意义作为文章的开始,而后深刻地分析了现在国内外对数据仓库技术的研究成果,在对现有技术的研究之上,本文采用自动化的数据处理技术和新颖的数据分层思想,并且对目标系统进行了需求分析和设计得知数据处理、数据建模、数据仓库管理和可视化是我们目标系统的四个重要组成部分。因此本文的主要研究内容有:1、数据处理使用Hadoop平台,Hadoop为数据仓库提供高效且廉价的数据处理平台,利用Hive sql方便了数据处理流程,并且自主设计使用SHELL脚本实现了ETL自动化过程,通过实验分析得出最佳线程数,使用Yarn来进行资源管理提高数据仓库的稳定性和扩展性,并且利用Map Reduce并行计算的优势,能够很好地支持企业大规模数据的处理。2、数据建模数据建模的核心是逐层解耦。越到底层越接近业务发生的记录,越到上层,越接近业务目标。数据仓库的建设使用维度建模法,在建模的同时设计数据分层,使数据变得更加可靠,数据结构更加明确,方便我们对数据进行血缘追踪,为数据开发提供极大的便利。3、可视化部分利用spring MVC+spring+mybatis+Echars作为整个系统的框架,向企业展示他们所关心的关键购销数据。4、测试部分针对各个功能模块设计了相应的测试用例。根据我们所设计的测试用例对系统的性能、功能以及安全性进行测试,测试结果在我们的预料之中,系统运转正常。
许诗怡[3](2020)在《森林资源数据仓库管理系统研建与数据分析应用技术研究》文中指出本研究首先论述了森林资源异构数据集成以及数据仓库技术在林业上的研究现状。森林资源数据仓库在实际应用中还面临着以下两大问题:一是数据存储存在差异,且数据表中的统计字段名称、类型、代码等的表达形式也存在差异;二是数据存储的差异性造成数据利用率不高,深层次的多维分析、数据挖掘等是基于规范化的数据进行的。针对这些问题,研究以历史上存储的森林资源数据为基础,针对森林生产功能分析、适地适树规则提取、生长收获预测模型拟合等的分析需求,设计建立了两个数据仓库:森林资源小班数据仓库以及标准地/样地数据仓库,并完成对两个数据仓库事实表、维度表字段结构的详细设计。通过对ETL技术的研究,实现对森林资源异构数据源的抽取、清洗和转换,并将处理后的规范化数据存储在目标数据仓库中进行统一管理。在此基础上,研建一个基于B/S体系架构的森林资源数据仓库管理系统。系统的主要功能包括异构数据源获取、森林资源异构数据的清洗转换、森林资源数据多维分析、数据挖掘等。本研究高效的利用已有的森林资源数据可以为林场等经营单位提供生长收获、抚育间伐、规则提取等方面的决策支持。
张雪雯[4](2020)在《基于数据仓库的管理驾驶舱系统的设计与实现》文中研究表明随着信息技术的快速发展,ERP系统、OA系统、CRM系统等管理信息系统已经广泛应用于各大企业的经营管理活动中,但随着企业业务范围的不断扩大,企业产生的数据量日益增长,对信息的简单管理已经不能满足当代企业的管理需求,各管理信息系统产生的数据缺乏互相联系,形成了大量的“信息孤岛”。企业如何将这些信息联系并利用起来,进而为管理层提供决策支持已经成为企业发展的当务之急。为解决上述问题,本文通过对某投资企业信息系统现状及各部门需求的调研,采用B/S架构设计并实现基于数据仓库的管理驾驶舱系统,将与企业经营状况相关的系统数据、电子文档数据和外部数据收集起来,并在此基础上进行数据分析与数据挖掘。在设计管理驾驶舱系统时,本文通过需求分析将系统模块划分为数据获取模块、数据管理模块、数据分析模块、风险预警模块、系统管理模块和登录模块。数据获取模块中为了解决数据集成的问题,在Hadoop集群上通过星型建模方式建立Hive数据仓库,并使用Kettle对源数据进行ETL处理,将数据按照一定的规则转换后加载至数据仓库中进行存储,形成了统一的数据中心。数据管理模块旨在解决数据仓库中元数据管理的问题,保证数据的质量。数据分析模块中使用大数据分析组件Kylin对数据进行OLAP分析,同时,为了更加直观的展示OLAP的分析结果,通过HTML5、Vue和ECharts组件将分析结果以多样化图表的形式进行展示,实现数据的可视化。风险预警模块的目的是提高企业应对财务危机的能力,本文设计并训练Logistic回归模型,用于预测财务危机发生的概率,实现对财务危机风险的预警功能。系统管理模块中使用Shiro框架实现用户权限控制,并在登录模块中对用户名及密码进行验证,实现系统的访问控制,保证系统的安全性。目前,管理驾驶舱系统已经建设完成并投入使用,系统运行状况良好,不仅为企业管理层决策提供了良好的数据支撑,还通过建立健全数据分析的指标体系,消除了数据上报口径不一致的问题,提高了数据分析的效率。
周淑君[5](2020)在《中职计算机应用专业学生成绩分析中数据仓库和数据挖掘的应用》文中进行了进一步梳理《加快推进教育现代化实施方案(2018-2022年)》提出要充分利用信息技术开展人才培养模式和教学方法改革,加强学生学习行为数据的数字化记录和分析,以信息技术推动职业教育质量提升。基于大数据技术的学习分析的出现及应用对我国教育信息化的发展具有积极意义,但从现有的研究文献中了解到,基于大数据技术的学习分析研究多集中在高等教育领域,在中职教育中还有待进一步推广和深入研究。虽然传统的教学方式也能对学生学习数据进行分析,其结果也能对学生学习效果产生影响。但传统的方式周期过长,信息化程度较低,学习分析技术的应用可弥补这些不足。因此本文结合中职计算机应用专业学生实际和特点,利用文献研究法对数据仓库和数据挖掘在学习分析中的应用进行分析和研究,主要工作如下:首先构建了应用于中职计算机应用专业的学习分析模型;以重庆市垫江县第一职业技术学校计算机应用专业学生相关数据为来源,设计和搭建了数据仓库;通过关联规则算法对学生成绩数据进行挖掘,得出课程之间的关联性及先后排序建议;在分析过程中考虑到,学生的个体因素对学生成绩的影响,运用了K-Means对学生数据进行聚类分析,根据聚类结果的若干特点提出具有针对性的教学建议。为了更好的将挖掘结果应用到实际教学中,本文提出一种将关联规则和聚类挖掘结合的新方法,将关联规则得出的课程关联和聚类分析的成绩影响因素构成新的挖掘属性,完成对学生成绩的低分预警,以网页可视化形式反馈给教师,可实现对学生学习行为的提前干预。本文应用数据仓库和数据挖掘技术对中职计算机应用专业学生数据进行分析,为中职计算机应用专业的教学和管理提供可资借鉴的途径和方法。可视化的低分学生成绩预警,也可以为教师干预学生行为,提供更准确更科学化的依据,以达到提高学生整体质量,有针对性的展开教学工作,优化教学效果的目的。
郑丹辉[6](2020)在《大数据仓库数据模型在电子政务中的应用研究》文中进行了进一步梳理大数据时代,数据引擎已成为组织服务创新、经济社会发展和国家治理能力现代化的核心驱动力,构建大数据驱动的政务新平台,成为电子政务发展的重要内容。基于关系型数据库系统的传统数据仓库在存储、加工及分析规模庞大、种类繁多的数据方面存在局限性,电子政务领域数据归集遇到数据质量问题,导致数据可信度差,影响数据共享和大数据辅助决策分析,亟需通过大数据仓库数据建模实现对数据有效管理和治理。数据集成于大数据仓库,针对大数据体量庞大的特点,在多数场景下不可能每次都采集全部数据,海量数据增量采集被广泛关注。本文从大数据仓库的数据模型分层、数据治理模型和数据增量采集三个方面,研究探讨了大数据仓库数据模型及在电子政务中的应用。第一,依据Kimball提出的数据仓库维度建模理论,基于Hadoop的Hive数据仓库,给出大数据仓库数据模型的分层架构。架构整体分为数据缓冲层(STG)、操作数据层(ODS)、公共数据层(PDW)和数据应用层(ADM)。结合数据分层和命名规则,设计实现大数据仓库分层的数据模型,在电子政务中应用大数据仓库分层架构,发挥大数据辅助科学决策和精准施策。第二,针对政府部门归集数据遇到的数据质量低劣问题,参照数据治理框架中的数据治理过程和数据模型分层架构,研究探讨了数据质量治理模型。模型从数据质量规则和数据质量反馈闭环两方面,引导源头数据从内容格式、数据模型和数据标准上优化改进,满足数据质量提升的需求。数据质量规则分为:数据清洗转换规则和数据质量稽核规则。数据质量反馈闭环,采用PDCA质量管理方法,将质量问题进行溯源。第三,研究数据集成全量和增量同步技术,提出非侵入式变化数据捕获方法NICDC。综合时间戳和全表比对的思想,设计时间和空间两种维度计算方法,从数据行和数据列对增量数据捕获能力进行提升。在实践中,使用NICDC方法无需对业务系统进行升级改造,能够快速捕获增量数据,提高大数据仓库集成数据的效率和增量数据的准确性。
田晚彤[7](2019)在《数据仓库和联机分析在医院数据决策分析的研究和应用》文中研究指明很多医院非常注重医疗服务信息化建设,医疗信息系统的大量应用提高了诊治过程和医疗服务的透明度,医疗质量得到较大提升。使用很长时间之后,这些系统中存在着大量数据,虽然这些历史数据与不断产生的新的数据之间还存在着关联性,但是因为受系统功能限制,数据并没有得到充分利用,其价值被忽视和浪费。因此,对于医院管理系统中的历史医疗数据进行数据清理,多维分析医疗业务并为管理者提供有价值的决策支持信息,成为各医疗机构开始重视的问题。本文研究了当前医院管理信息系统在数据使用中存在的问题,经过实地调研,了解了医院管理者的具体业务需求,利用数据仓库技术和联机分析技术设计数据仓库模型并对进行数据清理和分析。具体的解决方案是首先确定数据仓库主题,设计并搭建了数据仓库逻辑模型;其次,利用数据仓库数据清理工具对医院管理信息系统数据进行数据清理;然后,依据数据仓库主题,利用联机分析技术分析了医院管理者所关注的一些医院业务,结合SQL Server Analysis Services工具以图形化形式展示数据分析结果;最后,据此提出一些决策支持建议,为管理者的科学决策提供数据支持。本文设计的基于联机分析技术的数据仓库在运行期间表现良好,对医院管理信息系统多年积累的数据重新进行了数据清理,将医院业务中存在的业务需求以图形方式清晰展示给医院管理者,极大方便了用户从医院管理信息系统历史数据中发现有价值的信息,同时为医院管理者提供决策建议,具有较好的实用价值。
张申[8](2019)在《数据仓库技术在高校招生就业决策中的应用研究》文中研究表明随着科技的发展,社会已进入大数据时代,人们对信息的价值越来越重视,数据仓库的重要性达到了空前的高度。数据仓库是以数据库的技术为基础,在当下需要研究大量、多源、异构、动态的海量数据中,日益发展起来的。当下就业形势日益严峻,全国各个高校对招生就业的问题引起高度重视,学生选择高校的意向是什么,哪些专业的学生在什么样的工作部门就业率高,都是值得我们关注的焦点问题。本论文围绕如何更好地指导招生就业管理和决策提出一系列的问题,利用OLAP以及数据挖掘两项技术开展对论文数据的分析研究。首先,为了更好的、更合理的对数据仓库进行设计,本文运用了三种设计模型,分别是:物理模型、概念模型以及逻辑模型。同时,为保障数据仓库的顺利建立,本文处理了招生和就业两大系统的数据源,对招生和就业数据分别进行了抽调、转换、清洗、加载等工作。其次,本文在熟悉了解招生就业业务流程的基础上,针对录取情况、生源质量、各专业增减生源的数量以及各年龄层的招生就业数据仓库进行分类分析和OLAP处理,从而获得了更具说服力的结果。第三,为探寻招生就业数据仓库中各数据的内在联系,本论文利用三种数据挖掘算法,包括关联分析、决策树分析和聚类分析进行数据挖掘,主要对决策树分析进行了属性值空缺和简化熵算法的优化和改进,分析得出函授站点、录取年份、学历层次、成绩档次、文化程度及报到注册率之间都存在关联。统计分析以上OLAP处理和数据挖掘的结果,最终对高校招生就业决策提出了建议及策略。本文的研究将数据仓库技术应用在招生就业领域,从众多历史数据中发现了各种潜在的有价值的规则,从而进一步科学地指导就业、高效地开展招生宣传,这将有助于提高高校招生的质量以及毕业生就业质量,对整个高校的发展、提高生源人才质量具有重要的实践意义。
周飞[9](2018)在《商业银行数据仓库的设计与数据挖掘》文中提出数据仓库技术经过多年的发展,在各行各业中已经得到了很广泛的应用,尤其是在金融行业的商业银行中运用的更加普遍。国际市场上的几个大的数据仓库软件厂商,如DB2,Oracle,Sql Server等,都提供了功能强大的数据仓库数据技术产品,为分散的业务数据集中统一存储提供了强大的软硬件保障。商业银行通过使用数据仓库,可以极大的提高数据使用的效率,为企业内部各业务系统的数据分析和数据挖掘打下了坚实的基础。本文基于国内某商业银行数据中心的数据仓库系统项目,开展了研究工作。首先介绍了近年来数据仓库的国内外发展状况,其次介绍了数据仓库与数据挖掘的相关理论概念,主要包括数据仓库技术,数据仓库与数据库的区别,数据调度ETL(Extract-Transform-Load)系统等。将商业银行各业务系统的特点相结合,对商业银行数据仓库的项目进行了需求分析,包括数据主题域分析,数据存储规划分析。此次数据仓库的架构设计以IBM BDW(Banking Data Warehouse)数据仓库方法论为依据,使用IBM公司的数据仓库软硬件产品来实现。通过数据调度ETL系统的开发与设计,实现了从各个业务数据源系统中抽取数据到数据仓库中进行集中存储,对业务数据进行数据分析,并提供了数据的查询分析展示界面。论文还运用机器学习算法,对信贷行业中借贷者是否会违约还款进行预测。采用违约不还款的10000个数据集样本和按时还款的10000个数据集样本作为研究对象,首先对借贷客户的借贷数据信息做数据预处理,运用逻辑回归、支持向量机、随机森林、K最近邻和多层感知器等机器学习算法来构造违约预测模型,进行用户是否违约预测。实验结果表明,多层感知器模型有最好的预测效果。本文通过对商业银行的数据仓库的设计和数据挖掘的研究,构建了一个可以有效解决数据整合存储的数据仓库模型,实现了商业银行业务数据的集中统一存储,为商业银行进行业务数据分析提供了统一分析平台。商业银行通过提升经营理念,优化组织架构,结合科学高效的数据仓库技术作为支撑,可以在大数据时代得到更好的发展。图34表13参57
马辉[10](2018)在《可拓室内设计数据挖掘研究》文中提出可拓室内设计数据挖掘研究是国家自然科学基金项目《面向可拓建筑策划与设计的可拓数据挖掘理论及其方法研究》(51178132)的重要组成部分,是建筑学、可拓学和数据挖掘领域的交叉研究课题。研究建立在以数据为新能源的数据时代发展初期,探索智能化实现室内设计的新路径。是对现有室内设计理论与方法体系的扩充。研究目的在于利用计算机可以识别并运行的可拓设计语言,将可拓学的学理思想充分嵌入到数据挖掘全链条过程中,优解室内设计问题,发现优选模式下的室内设计知识规律,用于数据化实现可拓室内设计,推动室内设计研究向更理性、更科学、更智能、更高效的方向发展。论文运用跨学科交叉研究、可拓创新研究等方法,将可拓建筑学理论和可拓数据挖掘方法融入到室内设计数据挖掘研究中,构筑了可拓室内设计数据挖掘的基础研究、理论研究、方法研究、应用研究的框架结构。可拓室内设计数据挖掘的基本理论研究,是在可拓建筑设计研究和可拓数据挖掘研究的基础上,深度思考可拓室内设计数据挖掘的基本理论问题,提出支撑后续方法和应用研究的基本理论,为研究展开奠定基础。论文提出了可拓室内设计的概念;提出了描述室内精神感受的感元系统;阐述了计算机可以识别的可拓室内设计基元表达理论;阐述了可拓室内设计思维模式理论和可拓集理论;辨析了可拓室内设计数据挖掘的涵义和修辞关系;明确了研究的方向和任务。可拓室内设计数据仓库的设计研究,是在充分思考可拓学的核心优势和充分考虑设计数据特点的基础上,为设计策略输出建立的可拓数据挖掘操作平台研究,是面向可拓室内设计的,适合可拓数据挖掘结构型质的仓库设计指导。研究建立了处理数据和可拓数据的准入端口;确立了仓库的构成内容;提出了符合可拓数据特点和可拓数据挖掘特点的拓点结构;提出了三项重要的建库逻辑:即指导仓库目标系统设计的面向主题性原则、指导仓库动力系统设计的双轮驱动原则、指导仓库结构系统设计的原型设计原则,为可拓室内设计数据挖掘操作提供平台支持。可拓室内设计数据挖掘的方法研究,是在现有数据挖掘方法研究和可拓数据挖掘方法研究的基础上,按照可拓室内设计问题模式建立的挖掘操作方法研究。本质上是在挖掘到的普遍规律约束下寻找设计最优解或最优区间,以灵活的方式提供满足不同需求下的个性化设计对策。研究建立了以技术路线为依据,以挖掘步骤为展开方式,以实例解析为佐证的挖掘方法体系,详细论述了可拓室内设计数据挖掘的三种基本方法和一种创新方法。其中,有监督的可拓分类挖掘方法、无监督的可拓聚类挖掘方法、描述数据依赖关系的可拓关联挖掘方法,是针对剔除数据雍余后的多数模式的数据分析方法,而代表少数模式的离群数据在设计创新中具有非常重要的意义,研究针对这部分异常模式提出了可拓室内设计离群点挖掘方法,是针对设计数据的创新的挖掘方法。可拓室内设计数据挖掘的知识类型及其应用研究,是在可拓室内设计数据挖掘方法研究的基础上进行的挖掘成果研究,以及基于挖掘成果的应用方式研究。数据挖掘也被称作知识发现,此部分研究是自动处理数据工具的最后一环,是可拓数据挖掘技术与专业内容的衔接与落地。研究呈现了通过可拓数据挖掘方法可以生成的具体的室内设计知识内容,囊括了四种主要的知识类型,并分别阐述了不同类型知识的直接应用和可拓应用模式,完成了面向可拓室内设计的可拓数据挖掘的全过程。总之,研究旨在以数据为基础,以模型为工具,以方法为指导,在可拓室内设计数据仓库的平台上,进行可拓数据挖掘研究,发现以预测、优选、创新为核心的室内设计知识规律,探索一条以数据和需求共同驱动,智能化解决设计问题的数据化设计创新之路。为此,研究建立了可拓室内设计数据挖掘的理论体系、数据仓库设计体系、挖掘操作的方法体系、挖掘结果及其应用体系,形成了完整的可拓室内设计数据挖掘的研究结构。研究工作为数据时代设计发展提供了应对的新策略,为室内设计智能化实现提供了逻辑基础,研究成果拓展了可拓建筑学的学术边界。
二、浅谈数据仓库技术(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、浅谈数据仓库技术(论文提纲范文)
(1)中医药大数据资源数据仓库构建及处方分析应用研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文主要工作 |
1.4 论文组织结构 |
2 相关研究方法 |
2.1 大数据相关技术 |
2.1.1 Apache Hadoop |
2.1.2 Apache Hive |
2.1.3 Apache Spark |
2.1.4 Apache Kylin |
2.1.5 Apache Dolphin Scheduler |
2.2 临床数据挖掘相关方法 |
2.2.1 倾向性评分匹配 |
2.2.2 药物配伍网络构建 |
2.2.3 多尺度骨干网络算法 |
2.2.4 药物集富集分析方法 |
2.2.5 互信息熵 |
2.3 关联规则挖掘方法 |
2.3.1 关联规则基本概念 |
2.3.2 关联规则挖掘过程 |
2.3.3 Apriori算法 |
2.3.4 FP-Growth算法 |
3 中医药大数据资源数据仓库研究及构建 |
3.1 中医药大数据资源数据仓库概述 |
3.1.1 数据仓库技术概述 |
3.1.2 中医药数据来源 |
3.2 中医药大数据资源数据仓库体系结构 |
3.3 中医药大数据资源数据仓库构建的准备工作 |
3.3.1 大数据平台搭建 |
3.3.2 中医药源数据分析思路 |
3.4 中医药大数据资源数据仓库数据模型设计 |
3.4.1 数据模型设计原则 |
3.4.2 主题域数据模型 |
3.4.3 多维数据模型 |
3.5 中医药大数据资源数据仓库命名规范 |
3.5.1 库名命名规范 |
3.5.2 表名命名规范 |
3.5.3 字段名命名规范 |
3.6 中医药大数据资源数据仓库ETL过程 |
3.6.1 数据抽取 |
3.6.2 数据处理 |
3.6.3 ETL任务配置 |
3.6.4 ETL任务结果 |
3.7 方药主题多维OLAP分析 |
3.8 本章小结 |
4 中医临床有效处方分布式挖掘方法研究 |
4.1 方法概述 |
4.2 慢阻肺数据集市构建 |
4.2.1 患者用药过程数据表设计 |
4.2.2 倾向病例匹配结果表设计 |
4.2.3 药物配伍网络结果表设计 |
4.2.4 核心药物子网结果表设计 |
4.2.5 药物富集分析结果表设计 |
4.2.6 药症相关性分析结果表设计 |
4.3 分布式分析方法设计与实现 |
4.3.1 分布式假设检验实现 |
4.3.2 消除混淆因素和样本均衡处理 |
4.3.3 分布式药物配伍网络构建 |
4.3.4 分布式核心药物子网提取 |
4.3.5 分布式药物富集分析 |
4.3.6 分布式药症相关性分析 |
4.4 实验结果 |
4.4.1 实验数据分析 |
4.4.2 分布式倾向病例匹配结果 |
4.4.3 分布式药物配伍网络结果 |
4.4.4 分布式核心药物子网结果 |
4.4.5 分布式药物富集分析结果 |
4.4.6 分布式药症相关性分析结果 |
4.5 本章小节 |
5 基于关联规则的中药方剂配伍规律分布式挖掘研究 |
5.1 频繁闭项集挖掘 |
5.1.1 频繁闭项集相关概念 |
5.1.2 Charm算法 |
5.2 分布式Charm算法 |
5.2.1 数据预处理 |
5.2.2 通过等价类划分数据集 |
5.2.3 分布式阶段 |
5.2.4 汇总阶段 |
5.3 频繁闭项集的分布式压缩算法 |
5.3.1 数据预处理 |
5.3.2 频繁闭项集压缩 |
5.3.3 分布式实现过程 |
5.4 实验与结果分析 |
5.4.1 实验数据描述 |
5.4.2 分布式Charm与传统Charm挖掘效率比较 |
5.4.3 分布式关联规则挖掘结果 |
5.4.4 分布式压缩频繁闭项集结果 |
5.5 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 未来展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(2)基于Hive的购销数据仓库系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文的组织结构 |
1.5 本章小结 |
第2章 相关理论基础 |
2.1 数据仓库技术 |
2.1.1 数据仓库的产生背景 |
2.1.2 数据仓库定义 |
2.1.3 数据仓库特点 |
2.1.4 数据仓库基本特性 |
2.1.5 数据仓库的相关概念 |
2.1.6 数据仓库的结构 |
2.1.7 数据仓库开发过程 |
2.1.8 数据仓库建模方法 |
2.2 ETL技术 |
2.2.1 ETL技术定义 |
2.2.2 ETL作用 |
2.3 sqoop技术介绍 |
2.4 Flume技术介绍 |
2.5 SSM框架 |
2.5.1 Spring |
2.5.2 Spring Mvc |
2.5.3 Mybatis |
2.6 ECharts |
2.7 本章小结 |
第3章 系统分析 |
3.1 业务需求分析 |
3.2 建设目标 |
3.3 系统功能性分析 |
3.4 系统性能需求 |
3.5 平台构建原则 |
3.6 本章小结 |
第4章 系统设计 |
4.1 系统架构设计 |
4.2 数据仓库设计 |
4.2.1 数据处理模块 |
4.2.2 数据建模模块 |
4.3 数据可视化 |
4.4 本章小结 |
第5章 系统实现 |
5.1 系统开发环境 |
5.2 系统主要功能实现 |
5.2.1 数据仓库实现 |
5.2.2 Web可视化实现 |
5.2.3 其它功能模块 |
5.3 本章小结 |
第6章 系统测试 |
6.1 测试环境 |
6.2 系统测试内容 |
6.2.1 系统功能测试 |
6.2.2 系统性能测试 |
6.3 本章小结 |
第7章 总结与展望 |
7.1 全文工作总结 |
7.2 未来工作展望 |
参考文献 |
致谢 |
(3)森林资源数据仓库管理系统研建与数据分析应用技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 森林资源异构数据集成的研究现状 |
1.2.2 数据仓库在林业上的应用研究 |
1.2.3 ETL技术的研究 |
1.2.4 OLAP技术的研究 |
1.2.5 林业数据挖掘技术的研究 |
1.2.6 小结 |
1.3 研究目标和内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 研究拟解决的关键问题 |
1.4 研究方法与研究技术路线 |
1.4.1 研究方法 |
1.4.2 研究的技术路线 |
1.5 研究数据 |
1.6 项目来源与经费支持 |
1.7 论文组织结构 |
2 研究的理论与技术基础 |
2.1 数据仓库技术 |
2.1.1 数据仓库的概念 |
2.1.2 数据仓库建模方法 |
2.2 ETL技术 |
2.3 OLAP技术 |
2.3.1 OLAP技术基本概念 |
2.3.2 多维分析的基本操作 |
2.4 数据挖掘技术 |
2.4.1 数据挖掘的概念 |
2.4.2 常用的森林资源数据挖掘算法 |
2.5 本章小结 |
3 森林资源数据仓库设计与构建 |
3.1 森林资源小班数据仓库设计 |
3.1.1 概念模型设计 |
3.1.2 逻辑模型设计 |
3.1.3 物理模型设计 |
3.2 标准地/样地数据仓库设计 |
3.2.1 逻辑模型设计 |
3.2.2 物理模型设计 |
3.3 本章小结 |
4 森林资源异构数据的ETL技术研究 |
4.1 森林资源异构数据ETL需求分析 |
4.2 数据抽取子模型 |
4.3 数据转换子模型 |
4.3.1 数据清洗模块 |
4.3.2 数据转换模块 |
4.4 数据加载子模型 |
4.5 本章小结 |
5 森林资源数据仓库数据分析实例 |
5.1 OLAP与数据挖掘 |
5.2 森林资源数据OLAP技术应用 |
5.2.1 多维数据立方体的建立 |
5.2.2 森林生产功能分析 |
5.2.3 龄组、林种多样性及动态变化分析 |
5.3 森林资源数据挖掘技术应用 |
5.3.1 适地适树规则提取 |
5.3.2 生长收获预测模型拟合 |
5.4 本章小结 |
6 森林资源数据仓库管理系统的研建 |
6.1 系统需求分析 |
6.1.1 用户需求分析 |
6.1.2 功能需求分析 |
6.2 系统结构设计 |
6.2.1 系统体系结构设计 |
6.2.2 系统功能结构设计 |
6.3 森林资源数据仓库管理系统运行实例 |
6.3.1 异构数据源获取 |
6.3.2 数据清洗、转换 |
6.3.3 数据仓库管理 |
6.4 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
个人简介 |
导师简介 |
致谢 |
(4)基于数据仓库的管理驾驶舱系统的设计与实现(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 论文的背景及意义 |
1.2 国内外发展现状 |
1.2.1 国内外数据仓库发展现状 |
1.2.2 国内外管理驾驶舱系统发展现状 |
1.3 论文的主要工作 |
1.4 论文组织结构 |
2 关键技术及理论 |
2.1 数据仓库技术 |
2.1.1 数据仓库概述 |
2.1.2 Hive |
2.1.3 ETL |
2.2 联机分析处理技术 |
2.2.1 OLAP概述 |
2.2.2 Apache Kylin |
2.3 逻辑回归模型 |
2.4 本章小结 |
3 管理驾驶舱系统的需求分析 |
3.1 整体需求分析 |
3.1.1 业务范围定义 |
3.1.2 系统角色定义 |
3.2 功能性需求 |
3.2.1 数据采集与处理需求 |
3.2.2 数据管理需求 |
3.2.3 数据分析需求 |
3.2.4 财务危机预警需求 |
3.2.5 系统管理需求 |
3.3 非功能性需求 |
3.4 本章小结 |
4 管理驾驶舱系统的总体设计 |
4.1 系统总体结构设计 |
4.1.1 ETL层设计 |
4.1.2 数据存储层设计 |
4.1.3 应用层设计 |
4.1.4 展现层设计 |
4.2 系统功能结构设计 |
4.3 本章小结 |
5 数据仓库的设计与实现 |
5.1 数据仓库的设计原则 |
5.2 基础数据表设计 |
5.3 概念模型设计 |
5.4 逻辑模型设计 |
5.5 物理模型设计 |
5.6 本章小结 |
6 管理驾驶舱系统的详细设计与实现 |
6.1 数据获取模块 |
6.2 数据管理模块 |
6.3 数据分析模块 |
6.3.1 分析方法概述 |
6.3.2 数据分析的设计与实现 |
6.4 风险预警模块 |
6.4.1 样本数据选择 |
6.4.2 财务预警指标体系 |
6.4.3 样本数据预处理 |
6.4.4 Logistic回归分析 |
6.5 系统管理模块与登陆模块 |
6.6 本章小结 |
7 管理驾驶舱系统测试 |
7.1 测试综述 |
7.2 功能性测试 |
7.3 非功能性测试 |
7.4 测试结果分析 |
7.5 本章小结 |
8 总结与展望 |
8.1 总结 |
8.2 展望 |
参考文献 |
作者简历及攻读硕士/博士学位期间取得的研究成果 |
学位论文数据集 |
(5)中职计算机应用专业学生成绩分析中数据仓库和数据挖掘的应用(论文提纲范文)
摘要 |
Abstract |
第1章 前言 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究目的 |
1.1.3 研究意义 |
1.2 国内外研究现状 |
1.2.1 学习分析的研究现状 |
1.2.2 数据仓库和数据挖掘在学习分析中的应用研究现状 |
1.3 论文主要工作 |
1.4 论文结构 |
第2章 理论基础及相关技术综述 |
2.1 学习分析 |
2.1.1 学习分析的概念 |
2.1.2 学习分析的要素与特征 |
2.1.3 中职计算机应用专业学习分析模型构建 |
2.2 数据仓库 |
2.2.1 数据仓库定义 |
2.2.2 数据仓库与数据库 |
2.3 数据挖掘 |
2.3.1 数据挖掘概述 |
2.3.2 数据挖掘与其他领域关系 |
2.3.3 数据挖掘过程 |
2.3.4 数据挖掘模型和算法 |
2.4 数据挖掘与数据仓库 |
2.4.1 数据挖掘与数据仓库的关系 |
2.4.2 数据挖掘与数据仓库在学习分析中的应用 |
2.5 本章小结 |
第3章 中职计算机应用专业学生学习分析数据仓库设计 |
3.1 中职计算机应用专业学生学习分析的数据仓库特点分析 |
3.2 中职计算机应用专业学生学习分析数据来源 |
3.2.1 数据来源 |
3.2.2 问卷情况 |
3.3 中职计算机应用专业学生学习分析数据仓库的模型设计 |
3.3.1 概念模型设计 |
3.3.2 逻辑模型设计 |
3.3.3 物理模型设计 |
3.3.4 数据仓库的数据加载 |
3.4 本章小结 |
第4章 关联规则在中职计算机应用专业学生学习分析中的应用 |
4.1 问题的提出 |
4.2 关联规则在中职计算机应用专业学生成绩分析中的具体应用 |
4.2.1 确定研究对象及目标 |
4.2.2 数据预处理 |
4.2.3 数据挖掘 |
4.3 关联规则挖掘结果分析应用 |
4.4 基于数据挖掘结果的教学建议 |
4.5 本章小结 |
第5章 聚类在中职计算机应用专业学生学习分析中的应用 |
5.1 聚类在中职计算机应用专业学生学习分析中的具体应用 |
5.1.1 确定研究对象及目标 |
5.1.2 数据预处理 |
5.1.3 数据挖掘 |
5.1.4 挖掘结果 |
5.2 K-Means挖掘结果应用分析 |
5.2.1 对学生家庭属性的聚类结果分析 |
5.2.2 对学生学习态度的聚类结果分析 |
5.2.3 学生成绩影响因素总结 |
5.3 基于数据挖掘结果的教学建议 |
5.3.1 班级建设 |
5.3.2 家庭层面 |
5.3.3 学生听课状态 |
5.4 本章小结 |
第6章 关联规则和聚类在中职计算机应用专业学生成绩预警中的应用 |
6.1 问题的提出 |
6.2 具体实施方案 |
6.3 本章小结 |
第7章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
(6)大数据仓库数据模型在电子政务中的应用研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 研究内容 |
1.4 组织结构 |
2 大数据仓库技术基础 |
2.1 数据仓库技术 |
2.1.1 数据模型设计 |
2.1.2 政务数据仓库 |
2.2 Hadoop架构体系 |
2.2.1 Hive |
2.2.2 大数据仓库 |
2.3 政务数据集成技术 |
2.3.1 政务数据同步规范 |
2.3.2 政务数据采集方式 |
2.4 本章小结 |
3 大数据仓库数据模型研究 |
3.1 数据模型分层架构 |
3.1.1 数据缓冲层(STG) |
3.1.2 操作数据层(ODS) |
3.1.3 公共数据层(PDW) |
3.1.4 数据应用层(ADM) |
3.2 政务数据质量治理模型 |
3.2.1 治理模型质量规则 |
3.2.2 治理模型闭环流程 |
3.3 政务海量数据增量采集 |
3.3.1 空间维度 |
3.3.2 时间维度 |
3.3.3 NICDC方法 |
3.4 本章小结 |
4 大数据仓库数据模型在电子政务中的应用实现 |
4.1 应用实现基础 |
4.1.1 应用实现框架 |
4.1.2 集群部署结构 |
4.2 大数据仓库分层数据建模实现 |
4.2.1 建模约定 |
4.2.2 Hive约定 |
4.2.3 STG层 |
4.2.4 ODS层 |
4.2.5 PDW层 |
4.2.6 ADM层 |
4.3 政务数据质量治理模型实现 |
4.3.1 数据质量规则 |
4.3.2 质量反馈闭环 |
4.4 政务海量数据增量采集实现 |
4.4.1 全量数据采集 |
4.4.2 时间戳增量采集 |
4.4.3 全表比对增量采集 |
4.4.4 NICDC增量采集 |
4.5 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
个人简历 |
在学期间学术成果和参与项目 |
致谢 |
(7)数据仓库和联机分析在医院数据决策分析的研究和应用(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景 |
1.2 国内外研究现状 |
1.3 论文研究目的 |
1.4 论文组织结构 |
2 相关理论和关键技术 |
2.1 数据仓库和数据库 |
2.1.1 数据仓库和数据库的特点 |
2.1.2 数据仓库与操作数据库区别 |
2.2 联机分析技术 |
2.2.1 联机分析系统组件 |
2.2.2 联机分析体系结构 |
2.2.3 联机分析规则 |
2.2.4 联机分析、数据挖掘和数据仓库的关联 |
2.3 本章小结 |
3 需求分析和数据仓库设计 |
3.1 需求分析 |
3.1.1 医院历史数据文件 |
3.1.2 医院总体需求 |
3.2 整体设计 |
3.2.1 解决方案 |
3.2.2 方案整体架构 |
3.2.3 系统开发环境和工具 |
3.3 数据仓库设计 |
3.3.1 数据仓库主题 |
3.3.2 维度设计 |
3.3.3 维表设计 |
3.3.4 事实表设计 |
3.3.5 逻辑模型设计 |
3.4 本章小结 |
4 医院数据分析决策应用 |
4.1 数据清理 |
4.1.1 数据抽取 |
4.1.2 数据有效性检查 |
4.1.3 数据转换 |
4.1.4 数据载入 |
4.2 联机分析应用 |
4.2.1 建立多维数据集 |
4.2.2 联机分析技术应用 |
4.2.3 图形化数据分析 |
4.3 决策支持建议 |
4.4 本章小结 |
5 总结与展望 |
参考文献 |
致谢 |
作者简历 |
附录 |
(8)数据仓库技术在高校招生就业决策中的应用研究(论文提纲范文)
摘要 |
Abstract |
第1章绪论 |
1.1 课题研究背景及研究意义 |
1.2 国内外研究现状 |
1.3 论文主要目标 |
1.4 论文主要工作 |
1.5 论文的组织 |
第2章相关技术与理论 |
2.1 数据仓库技术 |
2.2 OLAP技术 |
2.3 数据挖掘技术 |
2.4 决策支持系统技术 |
第3章业务流程和模型 |
3.1 某大学基本情况 |
3.2 招生业务流程和模型 |
3.2.1 高职院校招生业务流程 |
3.2.2 录取业务流程 |
3.2.3 系统登录与退出业务流程 |
3.2.4 新生报到业务流程 |
3.3 就业业务流程和模型 |
3.3.1 基本信息管理 |
3.3.2 毕业生管理流程 |
3.3.3 招聘管理业务流程 |
3.3.4 就业指导管理业务流程 |
3.3.5 签约管理业务流程 |
3.3.6 就业推荐管理业务流程 |
3.3.7 就业统计管理业务流程 |
第4章 招生就业决策数据仓库的设计与分析 |
4.1 需求分析 |
4.1.1 确定决策主题 |
4.1.2 系统结构需求 |
4.1.3 系统功能模块需求 |
4.1.4 系统开发环境需求 |
4.1.5 决策方案需求 |
4.2 决策数据仓库的设计与分析 |
4.2.1 数据仓库体系结构 |
4.2.2 招生就业数据仓库建模 |
第5章基于决策树算法的改进 |
5.1 决策树算法基本思想 |
5.1.1 决策树的生成 |
5.1.2 决策树的剪枝 |
5.2 常见决策树算法描述 |
5.2.1 ID3算法 |
5.2.2 C4.5 算法 |
5.2.3 CART算法 |
5.3 优化决策树算法 |
5.3.1 属性值空缺的优化 |
5.3.2 简化熵 |
5.4 克服属性选择的多值偏向优化 |
5.4.1 基于修正函数的算法 |
5.4.2 加权简化熵算法 |
5.4.3 基于用户兴趣度的简化熵算法 |
第6章招生就业决策系统的实现与应用 |
6.1 招生就业决策数据仓库的实现 |
6.1.1 源数据准备 |
6.1.2 数据仓库的创建与ETL |
6.1.3 OLAP的实现 |
6.1.3.1 多维数据集的建立 |
6.1.3.2 基于OLAP立方下的数据分析 |
6.2 高校招生就业决策支持系统的实现应用 |
6.2.1 系统环境 |
6.2.2 系统运行结果 |
结论 |
参考文献 |
攻读硕士学位期间所发表的学术论文 |
致谢 |
(9)商业银行数据仓库的设计与数据挖掘(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 选题背景及意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 本文研究内容与结构安排 |
第二章 基础理论与技术 |
2.1 数据仓库 |
2.1.1 数据仓库简介 |
2.1.2 数据仓库与数据库的区别 |
2.1.3 数据仓库与数据集市 |
2.1.4 元数据 |
2.2 数据调度ETL技术 |
2.2.1 数据抽取 |
2.2.2 数据转换 |
2.2.3 数据装载 |
2.3 数据挖掘 |
2.4 常用分类算法简介 |
2.4.1 逻辑回归 |
2.4.2 随机森林 |
2.4.3 支持向量机 |
2.4.4 最近邻算法 |
2.4.5 感知器 |
第三章 A商业银行数据仓库系统的需求分析 |
3.1 建设背景与目标 |
3.1.1 建设背景 |
3.1.2 建设目标 |
3.1.3 建设实施阶段 |
3.2 业务主题分析 |
3.3 业务数据分析 |
3.3.1 全局数据分析 |
3.3.2 数据存储规划分析 |
3.4 业务物理模型分析 |
3.4.1 表级逻辑分析 |
3.4.2 表空间规则 |
3.4.3 表命名规则 |
3.4.4 物理数据模型分析 |
3.5 数据仓库运行环境分析 |
第四章 A商业银行数据仓库的设计与展示 |
4.1 系统整体架构 |
4.1.1 数据存储结构 |
4.1.2 数据查询结构 |
4.2 数据库设计 |
4.2.1 数据库架构设计 |
4.2.2 数据库查询优化 |
4.3 数据的备份 |
4.4 ETL系统模型设计 |
4.4.1 ETL系统的功能与特点 |
4.4.2 ETL系统架构设计 |
4.4.3 ETL调度系统开发设计 |
4.5 ETL数据调度系统的实现 |
4.5.1 作业依赖关系梳理 |
4.5.2 调度作业开发实现 |
4.6 数据仓库的展示 |
第五章 信贷业务违约风险预测 |
5.1 信贷业务分析 |
5.2 二分类模型评估指标 |
5.2.1 预测类型 |
5.2.2 混淆矩阵 |
5.2.3 ROC与AUC |
5.3 数据处理与特征工程 |
5.3.1 业务数据分析与实验准备 |
5.3.2 特征提取 |
5.3.3 特征选择 |
5.4 应用模型与参数调优 |
5.4.1 模型选择及其特点 |
5.4.2 交叉验证与参数调优 |
5.5 实验结果与评估分析 |
第六章 总结和展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
作者简介及读研期间主要科研成果 |
(10)可拓室内设计数据挖掘研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及研究的目的与意义 |
1.1.1 研究背景 |
1.1.2 研究的目的与意义 |
1.2 国内外研究现状 |
1.2.1 建筑及室内设计人工智能的相关研究 |
1.2.2 可拓学与可拓建筑学的相关研究 |
1.2.3 数据挖掘与可拓数据挖掘的相关研究 |
1.2.4 研究综述 |
1.3 研究的内容与方法 |
1.3.1 研究的内容 |
1.3.2 研究的方法 |
1.4 论文研究框架 |
第2章 可拓室内设计数据挖掘的基本理论 |
2.1 可拓室内设计的理论基础 |
2.1.1 可拓室内设计的概念与模型表达 |
2.1.2 可拓室内设计的思维模式 |
2.1.3 可拓室内设计的分析方法 |
2.2 可拓数据挖掘的理论基础 |
2.2.1 可拓集理论 |
2.2.2 可拓室内设计数据挖掘的内涵 |
2.3 可拓室内设计数据挖掘的特点 |
2.3.1 面向可拓室内设计的可拓数据挖掘的特点 |
2.3.2 基于可拓数据挖掘的可拓室内设计的优势 |
2.4 可拓室内设计数据挖掘的任务与目标知识类型 |
2.4.1 描述性任务 |
2.4.2 预测性任务 |
2.4.3 目标知识类型 |
2.5 本章小结 |
第3章 可拓室内设计数据仓库的设计 |
3.1 建构可拓室内设计数据仓库的基础 |
3.1.1 可拓室内设计数据仓库与现有数据库的区别 |
3.1.2 数据库和数据仓库的平台选择 |
3.1.3 数据仓库的数据基础 |
3.1.4 数据仓库与联机分析处理技术 |
3.2 可拓室内设计数据仓库设计的原则 |
3.2.1 面向主题原则 |
3.2.2 双轮驱动原则 |
3.2.3 原型设计原则 |
3.3 可拓室内设计数据仓库的构成 |
3.3.1 基础数据仓库 |
3.3.2 可拓数据仓库 |
3.3.3 知识仓库 |
3.4 可拓室内设计数据仓库的拓点结构 |
3.4.1 量值拓点的关系体系 |
3.4.2 特征拓点的关系体系 |
3.5 本章小结 |
第4章 可拓室内设计数据挖掘方法 |
4.1 可拓室内设计分类挖掘方法 |
4.1.1 可拓室内设计分类挖掘方法阐释 |
4.1.2 确立分类挖掘设计问题 |
4.1.3 基于设计问题类别数据域的建立 |
4.1.4 基于可拓分析的可拓集建立与可拓挖掘 |
4.1.5 实例解析 |
4.2 可拓室内设计聚类挖掘方法 |
4.2.1 可拓室内设计聚类挖掘方法阐释 |
4.2.2 确立聚类挖掘设计问题 |
4.2.3 基于设计问题聚类特征树的建立 |
4.2.4 基于聚类分析的叶节点聚类与可拓挖掘 |
4.2.5 实例解析 |
4.3 可拓室内设计关联挖掘方法 |
4.3.1 可拓室内设计关联挖掘方法阐释 |
4.3.2 确立关联挖掘设计问题 |
4.3.3 基于设计问题数据项集的建立 |
4.3.4 基于关联分析的频繁项集发现与可拓挖掘 |
4.3.5 实例解析 |
4.4 可拓室内设计离群点挖掘方法 |
4.4.1 发散式挖掘 |
4.4.2 传导式挖掘 |
4.4.3 共轭式挖掘 |
4.4.4 转换桥式挖掘 |
4.5 本章小结 |
第5章 可拓室内设计数据挖掘的知识成果及其应用 |
5.1 可拓室内设计数据挖掘的形态要素型知识及其应用 |
5.1.1 挖掘的形态要素型知识 |
5.1.2 挖掘的形态要素型知识直接应用 |
5.1.3 挖掘的形态要素型知识可拓应用 |
5.2 可拓室内设计数据挖掘的主题风格型知识及其应用 |
5.2.1 挖掘的主题风格型知识 |
5.2.2 挖掘的主题风格型知识直接应用 |
5.2.3 挖掘的主题风格型知识可拓应用 |
5.3 可拓室内设计数据挖掘的文化特征型知识及其应用 |
5.3.1 挖掘的文化特征型知识 |
5.3.2 挖掘的文化特征型知识直接应用 |
5.3.3 挖掘的文化特征型知识可拓应用 |
5.4 可拓室内设计数据挖掘的行为与情境体验型知识及其应用 |
5.4.1 挖掘的行为体验型知识 |
5.4.2 挖掘的情境体验型知识 |
5.4.3 挖掘的行为与情境体验型知识直接应用 |
5.4.4 挖掘的行为与情境体验型知识可拓应用 |
5.5 本章小结 |
结论 |
参考文献 |
攻读学位期间发表的学术论文及其它成果 |
致谢 |
个人简历 |
四、浅谈数据仓库技术(论文参考文献)
- [1]中医药大数据资源数据仓库构建及处方分析应用研究[D]. 吴纪龙. 北京交通大学, 2021(02)
- [2]基于Hive的购销数据仓库系统的设计与实现[D]. 李英楠. 西南大学, 2020(05)
- [3]森林资源数据仓库管理系统研建与数据分析应用技术研究[D]. 许诗怡. 北京林业大学, 2020
- [4]基于数据仓库的管理驾驶舱系统的设计与实现[D]. 张雪雯. 北京交通大学, 2020(03)
- [5]中职计算机应用专业学生成绩分析中数据仓库和数据挖掘的应用[D]. 周淑君. 西华师范大学, 2020(01)
- [6]大数据仓库数据模型在电子政务中的应用研究[D]. 郑丹辉. 郑州大学, 2020(02)
- [7]数据仓库和联机分析在医院数据决策分析的研究和应用[D]. 田晚彤. 大连海事大学, 2019(07)
- [8]数据仓库技术在高校招生就业决策中的应用研究[D]. 张申. 北京工业大学, 2019(03)
- [9]商业银行数据仓库的设计与数据挖掘[D]. 周飞. 安徽建筑大学, 2018(01)
- [10]可拓室内设计数据挖掘研究[D]. 马辉. 哈尔滨工业大学, 2018(01)