一、多媒体数据库管理的数据表示模型与融合(论文文献综述)
李超[1](2021)在《基于支持向量机的视频元数据信息快速检索方法》文中研究表明为提高混合多媒体数据库混合预编码视频元数据信息检索能力,提出了基于支持向量机的视频元数据信息快速检索方法.构建多媒体数据库混合预编码视频元数据的像素大数据检测模型,重组多媒体元数据像素信息.利用深层次混合预编码视频参数分析方法构建结构重组模型,对采集分辨多媒体数据库混合预编码进行稀疏度特征分解,根据多媒体数据库混合预编码视频元数据的哈希编码结果实现信息重组,采用支持向量机算法,实现元数据的信息融合聚类,建立视频元数据信息快速检索的像素通道,根据边缘像素特征分布式融合和视频帧序列重组方法,实现视频元数据信息快速检索.结果表明,采用该方法进行视频元数据信息检索的速度较快,时间开销较短.
姜海坤[2](2021)在《基于异构神经网络的音频舆情分析系统研究与实现》文中研究说明随着移动互联网技术的飞速发展,公众可以通过网络随意针对社会热点事件进行转发和点评,从而导致网络舆情事件爆发。近年来,舆情事件信息的主体逐渐由文本数据转变为视听化程度更高的音视频数据,由于音视频数据存在时长差异且极有可能出现超长时的情况,针对这类音频数据无法直接进行识别分析,同时现有的语音识别系统未融合舆情领域知识和音频情感因素,无法针对音视频数据进行有效的舆情研判。针对以上问题,本文设计并实现了基于多特征输入的音频端点检测算法,实现超长时单文件音频数据按照语义间隔进行切分,切分处理后的短音频可以直接进行分析识别。本文设计并实现了结合智能纠错的音频语义识别模型,将音频数据转化为文本描述,并实现针对识别结果中存在的识别错误进行自动纠正。本文设计并实现融合音频情感的舆情研判模型,结合舆情领域知识构建舆情分类体系,参考舆情分类体系和音频情感因素进行音频舆情研判。最后,本文按照异构神经网络的思想将多个模型进行整合设计并实现基于异构神经网络的音频舆情分析系统,提供从音视频数据采集、数据分布式传输到音频舆情分析和结果前端可视化呈现的完整功能。实验通过系统采集模块获取网络社区和开源语音数据库音视频数据,分别针对音频端点检测算法、音频语义识别模型、音频情感识别模型和舆情研判模型进行实验验证。本文提出的音频端点检测算法在混合场景下的效果优于参照的三种算法;本文提出的音频语义识别模型与基线模型RCNN相比,字错误率降低了 5.22%;音频情感识别模型与3D-ACRNN模型相比,未加权精度提升了 4.06%;本文提出的舆情指数计算模型和Fasttext舆情研判模型与特定舆情事件检测方法相比,F值分别有所提升。实验结果表明,本文提出的基于异构神经网络的音频舆情系统可以有效的针对网络中音视频数据进行舆情分析。
周玮[3](2021)在《多源图像及视频感知质量评价方法研究》文中研究说明图像及视频是人眼视觉感知和机器模式识别的重要信息来源,其感知质量对所获取信息的准确性和充分性起着至关重要的决定性作用。在日常生活中,我们人类每天需要处理大量的视觉信息。在接收这些视觉信息之前,多媒体数据通常需要经过整个信息处理链,包括从采集、压缩到传输、重建和显示等。在这个过程中,原始多媒体数据在不同的处理阶段经历了各种各样的感知质量退化。因此,如何有效地对处理后图像及视频的用户体验质量进行预测和优化是一个开放而重要的研究课题。与此同时,随着显示技术和设备的不断发展,立体图像和视频、全景和超分辨率等多媒体信息已经逐渐普及,例如不断涌现的三维电视和头戴式显示设备可以给观众提供一种区别于平面2D内容的全新视觉观看体验。然而,在观看不同格式的图像和视频时仍存在许多质量问题。本文据此面向多源图像及视频感知质量评价方法展开研究,主要研究内容如下:(1)设计基于深度学习的2D图像和视频质量评价方法。由于人类视觉系统依据多尺度信息进行视觉感知,本文在亮度通道的失真图像和残差图像上利用金字塔特征学习的方法,建立端到端学习多尺度特征的深度神经网络,用于预测失真2D图像质量。在四个公开图像主观质量评价数据库上,该模型均取得了比现有图像质量评价方法更优的性能。此外,视频质量评价相对图像质量评价来说,除了需要考虑空域失真,还包括复杂的时域特性。本文利用预训练深度学习模型,分别在视频帧和相邻帧的帧差图上提取局部和全局的空时域特征进行融合,实验结果表明该方法能有效预测感知视频质量。(2)建立基于最新立体视频编码标准的主观质量评价数据库。与传统2D内容质量评价相比,立体内容质量评价既要考虑图像质量,又要对深度感等其他质量维度进行评价。为了研究多维质量之间的关系和影响各个质量维度的关键因素,基于最新3D-HEVC视频编码标准,本文对原始高清立体视频进行不同图像质量的压缩,并伴随着各种深度感知质量。接着,让被测者进行随机观看打分,建立主观质量评价数据库。并且通过分析所建立的数据库,探究不同的失真等级和深度范围对各种3D视频内容的视觉感知质量的影响。(3)提出基于手工特征的无参考立体视频质量评价算法。本文首先提出一种比特流级别的无参考客观立体视频质量评价模型,提取3D压缩视频比特流中的一些相关特征,通过支持向量回归模型来预测3D视频的感知质量。实验结果表明,与现有的全参考2D和3D像素级别客观质量评价方法相比,所提出的算法取得了显着的性能提升。其次对图像质量和深度感知质量分别建模来描述针对整体3D体验质量的不同方面。根据人类视觉皮层对于3D视觉信号的响应,提出深度感知质量评价模型,并且在所建立的基于最新3D视频编码标准的主观质量评价数据库上验证了该模型的有效性。随后,将所提出的深度感知模型的关键部分扩展到立体视频整体体验质量评价中,在双目相加相减通道上分别提出融合自然场景统计特征和自回归预测的视差熵度量。在三个公开数据库上进行了实验,实验结果证明该方法在不同类型失真的对称及非对称的立体视频上均有着很好的效果。(4)设计基于双流深度卷积神经网络的无参考立体内容质量评价方法。深度卷积神经网络在学习判别特征方面具有显着能力,为无参考评价图像和视频感知质量提供了有效解决方案。考虑到立体图像包含左右视2D图像,双流深度卷积神经网络可以采用左右视2D图像作为输入。结合人类视觉系统中的双目视觉机制,本文提出对偶交互式深度卷积神经网络。针对图像块对进行端到端训练学习,从而融合得到立体图像的感知质量。由于现有的立体视频主观质量评价数据库规模相对较小,需要对失真立体视频进行预处理。本文通过三步提取失真立体视频中的时域中间帧作为视频关键帧,从而生成对应的视频子序列。将关键帧划分成图像块,分别输入双流深度卷积神经网络学习立体视频的感知质量。实验结果表明,所提出的两个网络模型在公开的立体图像和立体视频主观质量评价数据库上取得了比已有方法更好的性能。(5)提出基于手工特征的无参考全景图像质量评价算法。依据人类视觉系统的频率相关特性和全景图像的观看过程,本文提出一种结合多频信息和图像自然度的无参考全景图像质量评价方法。首先通过分解失真全景图像得到低频和高频子带,计算子带图像的熵强度来反映全景图像的多频信息。其次,从等距柱状投影图和各个视窗图像中分别提取全局以及局部自然度特征。最后,融合多频和自然度特征获得全景图像的感知质量。在两个公开的全景图像主观质量评价数据库上展现出该模型的优越性。(6)设计基于感知特性的超分辨率图像质量评价方法。由于不同的图像超分辨算法会生成不同质量的重构图像,本文设计了全参考和无参考超分辨图像质量评价算法。其中全参考方法在结构保真度和统计自然度两个方面,提出针对超分图像的二维质量评价,并且通过线性融合得到超分辨图像的感知质量。无参考方法根据超分辨图像的结构和纹理失真特性,通过自适应裁剪图像块的方式生成图像数据,输入所设计的深度神经网络。实验结果表明,所提出的全参考和无参考超分辨图像质量评价方法在公开数据库上优于现有图像质量评价算法。
韦帅丽[4](2021)在《任务型对话系统开发平台的设计与实现》文中认为任务型对话系统被广泛应用在各个领域和产品中,在帮助企业提高服务质量、提升用户体验的同时又能有效降低人力成本。传统搭建任务型对话系统主要存在以下三个问题:1)高度依赖自然语言处理(Natural Language Processing,NLP)专家,且各个环节分散进行,没有形成工程化流程。2)对话管理语料是基于用户输入的原始语句标注的包含意图词槽以及历史对话状态信息的严格结构化的对话故事流,人工标注困难且难以保证标注质量。3)传统任务型对话系统难以在基于任务的多轮对话过程中灵活处理基于知识库检索的问答。针对以上问题和挑战,本文对传统搭建任务型对话系统的流程进行工程化封装,主要研究内容如下:1)设计并实现一个任务型对话系统开发平台。解耦业务和技术,内置AI能力解除AI专家依赖,提供一套清晰规范的工程化搭建流程。开发者只需要配置意图词槽、标注语料,即可一键训练一个支持多媒体响应、融合QA(Question-Answering)知识库问答的任务型对话系统。2)提出并实现一种对话管理方案和对话管理语料的构建方法和工具。设计一种树形对话流结构,实现一个对话故事拖拽编辑器,通过编排对话节点构建可执行对话故事流,快速高效构建对话规则并且能够转化为对话管理语料。此外,设计一种联合规则和深度学习模型的对话管理方案,使得对话系统的对话管理部分既能拥有规则带来的准确性,又能拥有深度学习模型的学习能力。3)设计一种在多轮对话pipeline结构中有效融入QA知识库问答的任务型对话系统方案,使得对话系统能够高效协同处理基于任务的多轮对话和基于知识库的检索问答。此外,设计一个QA问答模块,将其划分为基于BM25(Okapi Best Matching 25)算法的初排子模块和基于 BERT 模型(Bidirectional Encoder Representations from Transformers)的精排子模块,在保证系统准确率的同时有效降低响应时延。最后,以该平台为工具构建了疫苗预约场景下的智能客服,验证了本文平台及方案的完整性、有效性及实用性。
王阮[5](2021)在《数字人文视域下口述历史档案资源知识发现研究》文中进行了进一步梳理近年来,数字人文在中国学界方兴未艾。数字人文对知识生产方式的改变,好比在学术圈这个相对平静的湖水中投进一颗石子,泛起的涟漪会波及整个学术领域[1]。2017年,中共中央办公厅、国务院办公厅印发的《国家“十三五”时期文化发展改革规划纲要》指出:文化遗产保护工程需加快文物藏品数字化保藏,推进数字故宫、数字敦煌、数字丝绸之路和中国人民抗日战争数字博物馆建设[2]。在数字化浪潮中,人文活动在数字技术赋能下跨界融合,借助数字技术耕读人文知识,变革传统的人文研究范式,并赋予人文研究以新的活力。数字人文正在引领中国社会文化空间的数字化转型,身处数字环境的人们对历史档案文化的知识需求也愈加强烈。《全国档案事业发展“十三五”规划纲要》在有效推进档案资源体系建设过程中鼓励开展口述历史档案、国家记忆和城市(乡村)记忆工程、非物质文化遗产建档等工作。口述历史档案作为历史文化传承的重要载体与纽带,以记录时代变革、填补记录空缺、保护人类文化遗产等价值和功能受到国内外学者的高度关注。我国悠久的历史文化世代相传,随着时间的洗淘,诸多珍贵的文化遗产已经失传或濒临灭亡。1992年,联合国教科文组织启动世界记忆工程项目,旨在通过国际合作与应用数字技术抢救世界范围内正在逐渐老化、损毁、消失的文献记录。有关口述历史档案的研究最早可追溯至美国哥伦比亚大学口述历史研究室的建立。虽然从启动时间看,我国研究起点较美国晚了近30年,无论理论基础还是实践进展都缺少资源深度开发和知识挖掘,尚处于起步成长阶段。但作为中华文化的守护者和传承者,我国拥有相当丰富且数量庞大的人文资源亟待挖掘。在数字人文的大背景下,如何借助数字人文技术方法检索、利用浩瀚繁杂的口述历史档案资源,将其蕴含的丰富内部事实、数据和知识展现出来,实现口述历史档案资源知识发现具有迫切性和必要性。同时,如何对口述历史档案资源进行深度知识组织、知识关联、知识聚合与知识发现,为用户提供知识服务,也将成为当下及未来档案资源开发利用的研究重点。基于此,本文以口述历史档案资源为研究对象,通过对口述历史档案、知识发现的追本溯源,综合运用文献分析、专家访谈、实证研究等方法,结合口述历史档案资源特征与属性,架构数字人文视域下口述历史档案资源知识发现框架,探究数字人文视域下口述历史档案资源知识发现核心内容,构建口述历史档案资源本体与知识图谱并进行实例可视化展示,深入揭示口述历史档案资源知识元,将其蕴含的人、地、时、事等复杂内容关系予以揭示,辅助和支撑人文学者进行研究,为口述历史档案资源实践应用提供可操作性指导,实现口述历史档案资源多维知识发现。具体来说,核心内容包含4个部分。第3章数字人文视域下口述历史档案资源知识发现逻辑框架本章首先对口述历史档案资源知识发现需求进行分析,对口述历史档案资源知识发现目标进行概述,梳理口述历史档案资源知识发现流程及体系结构。然后,解析口述历史档案资源知识发现构成要素、功能要素、构成要素及功能要素关系,架构数字人文视域下口述历史档案资源知识发现框架。最后,对框架主要模块作用进行解构,包含知识组织的描述与揭示作用,知识关联的存储与链接作用,知识发现的多维挖掘作用。第4章口述历史档案资源本体构建口述历史档案资源纷繁浩杂,如何将零散杂乱的口述历史档案资源组织起来,就需要借助本体来实现。鉴于目前本领域尚未发现可复用的口述历史档案资源本体,故而需要自建本体,这也是本领域的创新之处所在。本章作为第五章的铺垫,通过构建口述历史档案资源本体呈现口述历史档案领域知识认可的概念及概念间的相互关系,从知识组织维度实现口述历史档案资源知识表示,并利用Protégé工具辅以实例可视化展示,验证了本文构建的口述历史档案资源本体具有良好的可操作性与实用性,为第五章口述历史档案资源知识图谱构建提供组织结构基础。第5章口述历史档案资源知识图谱构建本体只是从组织层面实现口述历史档案资源描述与揭示,而知识图谱是基于关联层面实现口述历史档案资源深度聚合。本章首先提出口述历史档案资源知识图谱框架设计构想,包含模式层和数据层,模式层既可以从口述历史档案资源本体解析、本体与图数据库的映射规则以及关系界定入手;也可以直接从口述历史档案资源数据源抽取所需要素。数据层包含信息抽取和知识融合两部分。然后介绍知识图谱存储和绘制工具。最后,基于第四章口述历史档案资源本体结构,引入实验数据源,采用目前主流的Neo4j图数据库构建口述历史档案资源知识图谱进行实例可视化展示,从知识关联维度实现口述历史档案资源深层聚合,构筑口述历史档案资源知识网系,实现知识关联,为第六章口述历史档案资源多维知识发现奠定关系主线。第6章口述历史档案资源多维知识发现本章在第五章口述历史档案资源知识图谱实例展示的基础上,基于知识图谱洞悉口述历史档案资源深层关系,从多维视角深入挖掘口述历史档案资源潜藏的丰富内部事实。具体包含:基于项目整体概况的知识发现、基于事件主题关系的知识发现、基于社会网络关系的知识发现以及基于时空网络关系的知识发现。既可以细致展现出口述历史档案资源间人、地、时、事之间的知识关联,又可以探求涉及同一主题或具有相关关系的多个口述历史档案资源之间的隐性关系,方便领域学者进行后续研究,以佐证本研究具有现实指导意义。综上所述,本研究在数字人文大背景下,将以本体和知识图谱为代表的数字人文技术方法“引介”口述历史档案研究,实现了口述历史档案资源领域本体和知识图谱构建新突破,同时借助实例可视化展示,将人、地、时、事等内容特征及其相互关系予以细粒度描述,从事件、时空以及社会网络关系等层面实现口述历史档案资源深层挖掘与多维知识发现,不仅丰富了多元学科理论与研究方法,而且还推进了口述历史档案资源实践创新。在“技术驱动+知识发现”的催化反应下,为口述历史档案资源深度开发提供了借鉴与可行指导,同时也对口述历史档案资源知识发现及可视化具体实施提供了可操作性框架参考,切实推动了口述历史档案资源知识组织、知识关联、知识发现与知识服务。
徐志伟[6](2021)在《基于情感关系模式和注意力检测的多媒体情感分析》文中提出科技的进步带动了多媒体技术的蓬勃发展,每时每刻都有海量的多媒体数据产生。这些承载着人类情感的多媒体数据是巨大的宝藏,值得我们去探索和挖掘。近年来,情感分析技术得到了越来越广泛的关注。高效的情感分析算法可以帮助人们理解和使用多媒体数据,降低生产和管理成本,提升人机交互的效率。本文重点研究了与情感分析任务相关的两个问题:多媒体情感标注和图像情感分布学习。情感标注任务的一大难点是如何建模情感关系模式,而图像情感分布学习的关键是如何提炼出具有表征能力的情感特征。对于前者,我们利用图卷积网络和对抗学习策略分别在模型特征层和标签层捕捉情感关系模式,深入挖掘多维情感之间的关联。对于后者,我们引入了注意力机制,从全局和局部两个角度强化算法感知图像中情感内容的能力。总的来说,本文提出了基于情感关系模式和注意力检测的多媒体情感分析算法,具体内容如下:1.提出基于情感关系模式的多媒体情感标注算法。该方法将局部情感关系模式和全局情感关系模式分别应用到模型的特征层和标签层,用于辅助算法进一步挖掘多媒体数据所蕴含的情感内容。在特征层,我们构建了情感关系图来建模多维情感之间的局部关系,并且通过图卷积操作生成每种情感的情感表征,这些情感表征将会作为外部知识注入到模型中。在标签层,我们采用了对抗学习来约束生成的多维情感标签,即引入额外的判别器与模型进行博弈,确保模型获得的标签尽可能逼近真实标签。实验阶段我们分别在Music、NVIE、FilmStim和Memorability这四个多媒体情感数据库上进行了对比实验,证明了算法相较于相关工作的性能优劣。同时进行的消融实验验证了算法不同模块的效用以及不同实验参数对模型表现的影响。2.提出基于注意力检测和关系建模的图像情感分布算法。以往的工作往往从图像的全局角度提炼视觉表征,从而忽视了局部区域所蕴含的情感内容。针对这一问题,我们提出了类情感注意力检测模块,通过多模态双线性池化为每种情感生成对应的注意力图。这些注意力图表明了图像各个区域引发对应情感的可能性。在此基础上算法会进一步生成全局情感注意力图,使得模型具备从全局和局部两个角度探索情感区域的能力。除此之外,我们引入了图卷积网络来增强情感区域之间的交流,帮助模型提炼更全面的情感表征。实验阶段我们在FlickrLDL和TwitterLDL数据库上和相关工作进行了比较,实验结果证明了算法的优越性。可视化实验进一步说明了算法所提出的注意力图生成机制的有效性,消融实验证明了算法各个模块的作用。综上所述,围绕多媒体数据情感内容分析这一课题,我们提出在特征层和标签层构建情感关系模式来改善情感标签难以建模的问题,同时通过引入局部和全局的情感注意力图来加强图像情感特征的表征能力,进一步提高情感分析的性能。
庾骏[7](2020)在《跨模态哈希学习算法及其应用研究》文中研究表明随着网络信息技术的发展,全球已经迈入了多媒体大数据时代。数据信息通常关联图像、文本、视频、音频等多种模态形式,多种模态数据分别以不同的展现形式刻画同一事物,表达相同的语义信息。跨模态数据间丰富的互补信息蕴藏着较大的经济价值,给社会发展带来契机。由于跨模态数据处在异构高维空间,且不同模态之间存在相关性,因此有效地学习跨模态数据潜在的低维共享空间对提升信息搜索精度非常重要。本文以跨模态数据为研究对象,结合哈希技术,设计有关跨模态哈希方法并研究其在跨模态检索、图像检索、文本检索和多媒体检索中的应用。本文主要研究内容概括如下:一、提出了基于矩阵分解的跨模态监督哈希模型。为了提升模型的判别性,我们利用已知的标签信息去学习类别属性信息,使得学习到的哈希特征保留了类别的属性信息。采用非线性的核映射保持了各模态内部样本间的相似性结构,有利于捕捉样本的非线性结构信息。提出的模型联合执行了分类器学习、子空间学习和标签一致性矩阵分解去学习判别性的统一哈希特征。二、提出了基于多种视图特征的跨模态监督哈希模型。鉴于单个视图的特征表示能力有限,信息捕捉不充分导致下游任务可利用的判别性信息不足,从而造成模型性能的提升受到限制。为了更好地学习紧凑的哈希编码,提出了多视图离散哈希模型,利用多种视图特征去表征跨模态数据,丰富了特征描述信息。在多种搜索任务上的大量实验结果表明多视图特征能大幅度提升检索性能。三、提出了基于Hadamard矩阵的跨模态融合哈希模型。传统的跨模态融合哈希为了提升模型的性能引入了较多的超参数,选择最佳超参数是比较费时费力的。为了解决这个问题我们基于Hadamard矩阵设计了一种新的线上跨模态融合哈希方法,该方法简单有效,涉及很少的超参数,并在哈希学习中保持了较好的判别性。在线上搜索过程中以自适应方式捕捉跨模态数据的动态变化信息。实验结果表明该方法在多媒体检索应用中具有较高的准确性和效率。由于该方法对超参不是特别敏感,因此能够被非常灵活的应用。四、提出了基于标签传播的跨模态半配对哈希模型。大多数现有的跨模态方法假定跨模态数据是完全对齐成对的,然而在现实中完全对齐的数据并不普遍,同时考虑有限的类别标记数据,提出了一种半配对半监督的哈希模型。该方法基于锚点样本构造跨模态相似度图用于标签传播,为未标记类别的数据生成伪标签,结合了特征学习和分类器学习来学习哈希。在半配对半监督和全配对半监督设置下的实验结果验证了该方法在跨模态检索任务中的有效性。五、提出了基于多模态图嵌入的跨模态无监督哈希模型。目前大部分无监督的跨模态哈希在学习哈希过程中没有同时考虑特征学习和跨模态数据的几何结构保持机制。提出的方法利用l2,1范数约束项学习紧凑哈希特征,视觉空间中的局部线性邻域结构和文本空间的语义关联直接被保持在哈希编码中。在标准数据集上的实验结果表明联合图嵌入和特征学习的无监督哈希在性能上有明显的提升。综上所述,本文在多种跨模态数据场景中提出了五种跨模态哈希方法,充分利用跨模态数据之间的互补性,语义关联和几何结构特性,提升模型在跨模态搜索、图像搜索、文本搜索和多媒体搜索应用中的准确性和效率。大量的实验结果表明所提方法相比已有的相关方法具有更好的性能和优越性。
祝汉城[8](2020)在《用户性格分析与个性化图像美学评价研究》文中进行了进一步梳理随着物质生活水平的不断提高,人们的精神文化需求也日益增强。我国社会现阶段主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。近些年,伴随着移动互联网和社交网络的快速发展,图像等多媒体内容呈现爆炸式增长,这在一定程度上满足了当下人们对美好精神生活的需求,比如,美景美食、艺术照片和影视电影等。因此,研究符合人们视觉审美需求的图像内容变得越来越迫切,对现阶段社会精神文明的建设具有重要意义。图像美学评价就是研究如何运用智能可计算技术来模仿人们对图像的审美感知能力并自动预测出美学评估结果,通过这种方式就可以筛选出符合人们审美需求的图像内容。但是由于人们的视觉审美具有高度主观性,往往会受到个人心理状态和情感因素的影响,因此图像美学评价是一项极具挑战性的任务。目前大多数的图像美学评价研究主要集中在大众化图像美学评价上,也就是预测大多数人对图像的审美评估结果,但是这些方法没有考虑到图像美学的主观特性,无法精准地评估特定用户的个性化图像审美结果。近些年,虽然也出现一些针对用户的个性化图像美学评价方法,但是这些方法主要是利用图像的客观属性对用户个性化的审美感知进行建模,忽略了用户的主观特性(如,性格特征和情感情绪)在其视觉审美感知的重要作用。因此,本文针对用户在图像审美感知中存在的上述问题进行研究,首先利用社交网络中用户对图像的审美偏好来分析与研究其性格特征,提出基于偏好图像的用户性格特征预测方法;然后把用户的性格特征作为重要的主观特性,辅助于图像美学评价方法,得到符合用户主观感知的个性化图像美学评价模型;最后针对个性化图像美学评价中存在的小样本特性,利用元学习方法构建美学先验元知识模型,使其快速适应目标用户的个性化图像美学评价任务中。因此,探究社交网络中用户性格分析与个性化图像美学评价方法是当前社会精神文明发展中迫切需要解决的问题,也是心理学、计算机视觉和人工智能等领域重要的研究课题。本论文围绕社交网络中用户对图像的主观性审美偏好进行分析,从用户和图像两个层面展开研究,首先利用用户对图像的审美偏好预测其性格特征,然后研究针对特定用户的个性化图像美学评价方法。主要研究内容分为以下四个方面:(1)图像的场景是一种高度抽象的语义特性,用户对图像场景有不同的偏好,这反映出了他们不同的性格特征。受到用户的性格特征与偏好图像场景之间关系的启发,本文提出了一种基于场景感知概率的用户性格特征预测方法。首先,利用基于卷积神经网络的场景识别方法对用户偏好的图像场景进行识别;然后,进一步生成用户偏好图像的场景概率分布;最后,利用场景概率分布特征构建线性回归模型,对用户的性格特征进行预测。在Pshyco Flickr数据集上的实验结果证明了提出的方法可以有效地通过偏好图像的场景信息预测用户的性格特征。(2)用户对图像的视觉注意力通常具有局部注意力特性,因此在基于偏好图像的用户性格特征预测方法中应该考虑到这种特性。本文提出了一种由分类网络和回归网络组成的弱监督双卷积网络的用户性格特征预测方法。其中,分类网络在只需要利用图像级的用户性格类别标签进行监督训练时,就可以捕获不同性格特征对图像的注意力区域特征;在回归网络中,通过结合图像的全局特征与局部注意力特征进一步地预测用户的性格特征;因此,该方法不仅可以通过用户的偏好图像预测得到他们的性格特征,而且可以获取不同性格特征用户对偏好图像的注意力区域特征。在Pshyco Flickr数据集上的实验结果表明,该方法优于目前国际主流的基于偏好图像的用户性格特征预测方法。(3)传统的图像美学评价方法主要针对大多数人的图像平均美学进行评价。然而,不同用户对图像的审美偏好却各不相同,这主要是因为他们具有不同的主观视觉偏好。性格特征作为一种重要的主观特性,是塑造用户主观偏好的关键因素。本文提出了一个基于性格辅助多任务学习的个性化图像美学评价方法。提出的方法框架包括两个阶段。在第一个阶段,提出了一个具有共享权重的多任务学习网络,用于同时预测图像的美学分布和偏好该图像的用户性格特征。为了获取图像的大众化美学和用户的性格特征的共同表征,本文构建一个孪生网络,将美学数据和性格数据用于联合训练多任务学习网络模块。在第二个阶段,基于多任务模块中预测得到用户的性格特征和大众化审美分数,进一步引入任务间融合学习模块,最终生成针对特定用户的个性化图像美学评价模型。该方法在两个公开的图像美学数据库进行了性能评估,实验结果表明,提出的方法在大众化和个性化的图像美学评价任务上都优于现有的主流方法。(4)由于在实际生活中难以获取特定用户对大量图像的审美标注样本,因此用户的个性化图像美学评价是一个典型的小样本学习问题。针对此问题,现有的个性化图像美学评价模型一般是通过把大众化图像美学评价模型作为先验知识进行微调而获得的。然而,这种基于大众化平均美学的先验知识无法体现出不同用户对图像审美的多样性。为了学习不同用户对图像进行美学评价时共享的先验知识,本文提出了一种基于梯度优化元学习的个性化图像美学评价方法,该方法可以直接通过对大量用户的个性化图像美学评价任务进行训练构建先验知识模型,然后通过目标用户的少量训练样本进行微调快速地泛化到该用户的个性化图像美学评价任务上。实验结果表明,提出的方法性能优于目前国际主流的个性化图像美学评价方法。
张帅[9](2020)在《分布式移动网络环境下大规模空间社交媒体数据快速增强现实可视化研究》文中提出增强现实技术被广泛誉为下一代人机交互通用平台技术,近年来受到了国内外学界与产业界的重点关注,迎来了爆发式增长。智能手机i OS与Android平台纷纷推出各自底层增强现实API,ARKit与ARCore,使得全球万亿智能手机都成了增强现实设备。2016年AR游戏Pokemon Go刚上线就火爆全球,一个月内获得了13000万次下载,迅速得到全球70多个国家民众的热捧。增强现实技术能够呈现炫酷引人入胜的3D模型动画,但当前领域内对简单社交多媒体数据,如文字、图片、音频、视频等,的增强现实可视化体验关注不够,而社交媒体数据却是普通用户最容易生产的数字内容,必然伴随着增强现实技术应用的普及而大规模产生。因此,研究社交媒体数据在增强现实环境中可视化问题,对增强现实技术的进一步平民化普及具有重要意义。在如今的大数据时代,当社交媒体数据规模日渐庞大时,在分布式移动网络环境下,研究大规模社交媒体数据快速增强现实可视化问题有着极其重要的应用价值,可视化效率问题严重影响着增强现实前端的用户体验,而优良的数据组织机制、高性能的数据处理架构是增强现实前端快速可视化的首要问题,因此本文的研究重点在于利用大数据技术去支撑增强现实前端快速可视化。另一方面,与传统社交媒体应用不同,社交媒体数据增强现实可视化问题是在现实生活中真三维环境中呈现的,具有鲜明的地理空间属性,属于空间社交媒体数据,因此,大规模空间社交媒体数据增强现实可视化能否快速响应一个关键因素是能否有效利用地理空间信息。本文在前人的研究基础上,对大规模空间社交媒体数据快速增强现实可视化问题的研究,主要从以下几个方面展开:(1)针对大规模空间社交媒体数据的增强现实可视化数据特征,研究适合网络大规模数据传输的空间社交媒体数据规范,提出了Geo ARMedia数据模型规范。Geo ARMedia数据规范参考了现行gl TF与Geo JSON数据标准,定义了常见空间社交媒体的数据模型规范,明确了常见多媒体数据类型(文本、图片、音频、视频等)的存储表达规范。(2)面向分布式集群环境下的大规模空间社交媒体数据存取技术需求,构建了利于数据库跨尺度平滑读写稳态Z曲线算法,研究了大规模空间社交媒体数据基于稳态Z曲线的常见空间查询算法,提出了基于稳态Z曲线的大规模空间社交媒体数据的分布式数据划分策略,优化数据分布式存储结构,提高了空间社交媒体数据的分布式存取效率。(3)研究基于智能手机设备的移动增强现实前端可视化空间的构建,定义了空间社交媒体数据在移动增强现实前端的可视域以及三层空间交互架构,提出了空间社交媒体数据增强现实可视化的球面模型,同时研发了借助地理信息能够大幅提高增强现实识别图命中效率的大规模社交图片检索的时空耦合算法,有效提升了空间社交媒体数据在移动前端增强现实可视化效率。(4)为了在分布式移动网络环境下快速响应大规模空间社交媒体数据加载请求,保障前端增强现实可视化的效率与稳定性,本文提出了空间社交媒体数据增强可视化多级缓存机制,利用空间社交媒体数据的空间邻近性,提出了增强现实可视化前端缓存预调度机制,以及基于地理位置的热点数据云端探测与分布式缓存调度机制,有效保障了增强现实快速可视化的速度与高并发响应要求。(5)大规模空间社交媒体数据增强现实可视化伴随着海量的计算任务,本文研究了大数据技术以及高性能计算技术,研发了面向大规模空间社交媒体数据的并行处理计算框架,提出了一种大规模空间社交媒体数据并行处理的代数方法,能够简洁有效的描述并行处理任务,组织调度多个并行计算算子协同工作共同完成相关任务,支撑了大规模空间社交媒体数据快速处理。(6)结合当前流行分布式数据库、大数据技术、可拓展网络服务架构、移动前端3D引擎技术,依托前文的研究成果,本文设计并开发了大规模空间社交媒体数据快速增强现实可视化原型系统——视网么,详细讨论了常见空间社交媒体数据的增强现实交互与视觉设计,实现了前后端增强现实服务,同时研发了移动端社交媒体数据增强现实编辑器,大范围降低了社交媒体数据增强现实内容生产门槛,最后本文以南京大学仙林校区周边为例展开应用实验,测试表明视网么在应对TB级数据规模千万级并发访问的空间社交媒体数据前端增强现实可视化任务可以在1秒内完成前端响应,达到了理想的研究实验效果。
教育部[10](2020)在《教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知》文中研究表明教材[2020]3号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:为深入贯彻党的十九届四中全会精神和全国教育大会精神,落实立德树人根本任务,完善中小学课程体系,我部组织对普通高中课程方案和语文等学科课程标准(2017年版)进行了修订。普通高中课程方案以及思想政治、语文、
二、多媒体数据库管理的数据表示模型与融合(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、多媒体数据库管理的数据表示模型与融合(论文提纲范文)
(1)基于支持向量机的视频元数据信息快速检索方法(论文提纲范文)
0 引言 |
1 混合预编码视频元数据分布和信息预处理 |
1.1 视频元数据融合处理 |
1.2 视频元数据信息特征分析 |
2 视频元数据信息检索优化 |
2.1 支持向量机编码算法 |
2.2 混合预编码视频元数据检索输出 |
3 仿真实验与结果分析 |
4 结语 |
(2)基于异构神经网络的音频舆情分析系统研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 论文研究内容 |
1.4 论文组织结构 |
第二章 相关关键技术 |
2.1 语音端点检测技术 |
2.1.1 特征选取 |
2.1.2 判决准则 |
2.2 深度学习技术 |
2.2.1 卷积神经网络 |
2.2.2 循环神经网络 |
2.3 语言模型 |
2.3.1 N-gram语言模型 |
2.3.2 BERT预训练语言模型 |
2.4 FASTTEXT文本分类 |
第三章 音频语义内容识别模型 |
3.1 音频语义内容识别模型设计 |
3.1.1 音频端点检测算法 |
3.1.2 音频语义识别模型 |
3.1.3 智能纠错模型 |
3.2 音频语义内容识别模型实现 |
3.2.1 音频端点检测实现 |
3.2.2 音频语义识别模型实现 |
3.2.3 智能纠错模型实现 |
3.3 音频语义内容识别模型实验 |
3.3.1 实验数据集及环境 |
3.3.2 实验验证方案 |
3.3.3 实验结果及分析 |
第四章 融合音频情感的舆情研判模型 |
4.1 融合音频情感的舆情研判模型设计 |
4.1.1 音频情感识别模型 |
4.1.2 舆情分类体系构建 |
4.1.3 舆情指数计算模型 |
4.1.4 Fasttext舆情研判模型 |
4.2 融合音频情感的舆情研判模型实现 |
4.2.1 音频情感识别模型实现 |
4.2.2 舆情指数计算模型实现 |
4.2.3 Fasttext舆情研判模型实现 |
4.3 融合音频情感的舆情研判模型实验 |
4.3.1 实验数据集及环境 |
4.3.2 实验验证方案 |
4.3.3 实验结果及分析 |
第五章 基于异构神经网络的音频舆情分析系统 |
5.1 基于异构神经网络的音频舆情分析系统设计 |
5.2 基于异构神经网络的音频舆情分析系统实现 |
5.3 系统测试流程 |
5.3.1 数据处理模块功能测试 |
5.3.2 音频分析模块功能测试 |
5.3.3 舆情研判模块功能测试 |
5.3.4 可视化呈现模块功能测试 |
第六章 总结和展望 |
6.1 研究工作总结 |
6.2 下一步研究工作展望 |
参考文献 |
致谢 |
攻读硕士学位期间发表的论文 |
(3)多源图像及视频感知质量评价方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 本文的研究背景及意义 |
1.2 2D内容质量评价的研究现状 |
1.2.1 主观2D内容质量评价 |
1.2.2 客观2D内容质量评价 |
1.3 立体内容质量评价的研究现状 |
1.3.1 主观立体内容质量评价 |
1.3.2 客观立体内容质量评价 |
1.4 360度全景质量评价的研究现状 |
1.4.1 主观360度全景图像质量评价 |
1.4.2 客观360度全景图像质量评价 |
1.5 超分辨率质量评价的研究现状 |
1.5.1 主观超分辨率图像质量评价 |
1.5.2 客观超分辨率图像质量评价 |
1.6 客观算法性能衡量准则 |
1.7 本文的主要工作与章节安排 |
1.7.1 主要工作 |
1.7.2 章节安排 |
第2章 基于深度学习的2D内容质量评价 |
2.1 引言 |
2.2 多尺度特征学习的2D图像质量评价方法 |
2.2.1 网络结构设计及训练测试方法 |
2.2.2 实验验证和算法性能分析 |
2.3 局部和全局时空特征融合的2D视频质量评价算法 |
2.3.1 时空域特征表示和融合 |
2.3.2 算法性能结果验证 |
2.4 本章小结 |
第3章 基于3D-HEVC标准的主观质量评价数据库 |
3.1 引言 |
3.2 主观实验方法 |
3.2.1 视频内容的选取方法 |
3.2.2 处理条件设计及主观测试 |
3.3 立体3D-HEVC视频数据库分析 |
3.3.1 原始视频序列的质量 |
3.3.2 主观一致性分析 |
3.4 影响不同质量维度的因素 |
3.4.1 多维质量之间的关系 |
3.4.2 视频质量和深度感知的关键因素分析 |
3.5 本章小结 |
第4章 基于手工特征的无参考立体视频质量评价 |
4.1 引言 |
4.2 码流级别的立体视频质量评价算法 |
4.2.1 基于3D-HEVC码流的视频特征提取 |
4.2.2 基于支持向量回归的质量映射 |
4.2.3 算法实验验证和性能比较 |
4.3 深度感知质量评价算法 |
4.3.1 基于自回归的视差熵度量 |
4.3.2 能量加权视频内容特征提取 |
4.3.3 算法预测性能验证和比较 |
4.4 基于脑视觉认知理论的盲立体视频整体质量评价算法 |
4.4.1 双目相加相减通道设计 |
4.4.2 融合自然场景统计特征提取 |
4.4.3 基于自回归预测深度感知的整体3D质量 |
4.4.4 实验验证和结果比较分析 |
4.5 本章小结 |
第5章 基于双流神经网络的无参考立体内容质量评价 |
5.1 引言 |
5.2 基于深度学习的立体图像质量评价模型 |
5.2.1 深度卷积神经网络结构设计 |
5.2.2 立体图像预处理 |
5.2.3 双流网络交互融合 |
5.2.4 图像块对的训练方法及局部质量池化 |
5.2.5 实验结果和性能分析 |
5.3 基于深度学习的立体视频质量评价算法 |
5.3.1 双流网络结构设计 |
5.3.2 立体视频预处理 |
5.3.3 面向图像块对的学习策略 |
5.3.4 算法性能验证和比较分析 |
5.4 本章小结 |
第6章 基于手工特征的无参考全景图像质量评价 |
6.1 引言 |
6.2 基于多频信息和自然度的全景图像质量评价算法 |
6.2.1 图像分解和多频信息 |
6.2.2 全局和局部自然场景统计特征 |
6.2.3 质量回归模型 |
6.3 实验结果验证及分析 |
6.3.1 数据库和评价准则 |
6.3.2 性能比较 |
6.3.3 不同参数的影响和统计显着性分析 |
6.3.4 各组成部分测试及跨数据库验证 |
6.4 本章小结 |
第7章 基于感知特性的超分辨率图像质量评价 |
7.1 引言 |
7.2 图像超分辨率全参考质量评价参数模型 |
7.2.1 针对超分图像的二维质量评价 |
7.2.2 融合二维质量评价 |
7.2.3 实验测试和性能比较 |
7.3 基于结构和纹理的图像超分辨率质量评价算法 |
7.3.1 图像表达和自适应裁剪 |
7.3.2 网络设计 |
7.3.3 感知质量学习和性能分析 |
7.4 本章小结 |
第8章 总结与展望 |
8.1 论文总结 |
8.2 未来展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(4)任务型对话系统开发平台的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景及意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状及分析 |
1.2.1 对话系统的国内外现状 |
1.2.2 任务型对话系统开发平台国内外研究现状 |
1.3 主要研究内容及创新点 |
1.3.1 主要研究内容 |
1.3.2 创新点 |
1.4 硕士在读期间主要工作 |
1.5 论文组织架构 |
第二章 相关理论与技术研究 |
2.1 管道式任务型对话系统结构 |
2.2 BM25算法 |
2.3 BERT模型 |
2.4 开源框架RASA |
2.4.1 RASA概述 |
2.4.2 RASA项目搭建 |
2.5 本章小结 |
第三章 任务型对话系统开发平台的设计与实现 |
3.1 需求分析 |
3.1.1 平台业务需求 |
3.1.2 平台功能需求 |
3.2 平台总体设计 |
3.2.1 搭建流程设计 |
3.2.2 总体架构设计 |
3.2.3 子系统设计 |
3.3 核心功能模块设计 |
3.3.1 对话方案设计 |
3.3.2 对话模版设计 |
3.3.3 对话模版匹配算法 |
3.3.4 数据闭环自优化机制 |
3.4 数据库设计 |
3.5 开发和部署 |
3.6 本章小结 |
第四章 一种对话管理方案和对话管理语料的构建方法和工具 |
4.1 研究挑战 |
4.2 研究方案 |
4.2.1 对话流结构 |
4.2.2 对话故事流构造规则 |
4.2.3 对话管理流程 |
4.3 有效性验证 |
4.4 本章小结 |
第五章 融合QA知识库问答的任务型对话系统方案的设计与实现 |
5.1 研究挑战 |
5.2 研究方案 |
5.2.1 任务型多轮对话与QA问答的融合方案 |
5.2.2 QA问答模块设计 |
5.3 实验设置和结果分析 |
5.3.1 实验数据 |
5.3.2 评测指标 |
5.3.3 实验方案 |
5.3.4 实验结果分析 |
5.4 工程有效性验证 |
5.5 本章小结 |
第六章 疫苗预约智能客服机器人的构建与应用 |
6.1 意图词槽定义 |
6.2 语料管理 |
6.2.1 NLU语料标注 |
6.2.2 DM语料构造 |
6.2.3 对话模版管理 |
6.3 知识库管理 |
6.4 素材库管理 |
6.4.1 多媒体编辑器 |
6.4.2 素材库管理 |
6.5 模型训练与管理 |
6.6 服务发布 |
6.7 对话效果测试 |
6.7.1 人工纠正对话测试 |
6.7.2 对话效果演示 |
6.8 日志管理与可视化分析 |
6.9 本章小结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 研究展望 |
参考文献 |
致谢 |
攻读研究生期间发表的学术成果 |
(5)数字人文视域下口述历史档案资源知识发现研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 选题背景 |
1.2 研究意义 |
1.2.1 理论意义 |
1.2.2 实践意义 |
1.3 国内外研究现状 |
1.3.1 口述历史档案研究现状 |
1.3.2 知识发现研究现状 |
1.3.3 研究现状述评 |
1.4 研究内容、研究方法与技术路线 |
1.4.1 研究内容 |
1.4.2 研究方法 |
1.4.3 技术路线 |
1.5 创新点 |
第2章 相关概念与理论基础 |
2.1 概念界定 |
2.1.1 口述历史档案 |
2.1.2 口述历史档案资源 |
2.2 档案信息资源开发理论 |
2.2.1 档案信息资源开发含义 |
2.2.2 档案信息资源开发意义 |
2.2.3 档案信息资源开发原则 |
2.3 本体理论 |
2.3.1 本体概念 |
2.3.2 本体分类 |
2.3.3 本体构建流程 |
2.3.4 本体在档案领域的应用 |
2.4 知识发现理论 |
2.4.1 知识发现定义 |
2.4.2 知识发现过程 |
2.4.3 知识发现方法 |
2.5 本章小结 |
第3章 数字人文视域下口述历史档案资源知识发现逻辑框架 |
3.1 数字人文视域下口述历史档案资源知识发现需求分析 |
3.1.1 数字人文时代的必然要求 |
3.1.2 口述历史档案资源开发需求 |
3.2 数字人文视域下口述历史档案资源知识发现目标与体系架构 |
3.2.1 口述历史档案资源知识发现目标 |
3.2.2 口述历史档案资源知识发现流程及体系结构 |
3.3 数字人文视域下口述历史档案资源知识发现框架 |
3.3.1 口述历史档案资源知识发现构成要素 |
3.3.2 口述历史档案资源知识发现功能要素解析 |
3.3.3 口述历史档案资源知识发现要素及功能关系 |
3.3.4 口述历史档案资源知识发现框架构建 |
3.4 数字人文视域下口述历史档案资源知识发现框架主要模块作用解构 |
3.4.1 口述历史档案资源知识组织的描述与揭示作用 |
3.4.2 口述历史档案资源知识关联的存储与链接作用 |
3.4.3 口述历史档案资源知识发现的多维挖掘作用 |
3.5 本章小结 |
第4章 口述历史档案资源本体构建 |
4.1 口述历史档案资源知识组织原则 |
4.2 口述历史档案资源元数据标准选择 |
4.3 口述历史档案资源元数据抽取 |
4.4 口述历史档案资源本体模型设计 |
4.4.1 术语词表构建 |
4.4.2 确认类的等级体系,定义类和属性 |
4.4.3 充实、修正本体 |
4.4.4 本体模型转换 |
4.5 口述历史档案资源本体实例化 |
4.6 本章小结 |
第5章 口述历史档案资源知识图谱构建 |
5.1 口述历史档案资源知识图谱框架设计 |
5.2 模式层组织 |
5.2.1 本体解析 |
5.2.2 本体与图数据库规则映射 |
5.2.3 关系界定 |
5.3 数据层组织 |
5.3.1 信息抽取 |
5.3.2 知识融合 |
5.4 知识图谱存储与绘制 |
5.5 口述历史档案资源知识图谱实例化 |
5.5.1 数据准备 |
5.5.2 口述历史档案资源知识图谱模式层组织 |
5.5.3 口述历史档案资源知识图谱数据层组织 |
5.5.4 口述历史档案资源知识图谱存储与绘制 |
5.5.5 口述历史档案资源知识图谱可视化 |
5.6 本章小节 |
第6章 口述历史档案资源多维知识发现 |
6.1 基于项目概况的知识发现 |
6.1.1 整体—局部分布 |
6.1.2 项目—时间分布 |
6.1.3 项目—地点分布 |
6.2 基于事件主题关系的知识发现 |
6.2.1 事件—项目关系的知识发现 |
6.2.2 事件—时间关系的知识发现 |
6.2.3 事件—地点关系的知识发现 |
6.3 基于社会网络关系的知识发现 |
6.3.1 基于口述项目本身的社会关系 |
6.3.2 基于口述项目内容的社会关系 |
6.4 基于时空网络关系的知识发现 |
6.4.1 基于社会关系的人物空间分布分析 |
6.4.2 基于任职经历的人物时空迁移轨迹分析 |
6.5 本章小节 |
第7章 研究结论与展望 |
7.1 研究结论 |
7.2 研究局限 |
7.3 研究展望 |
参考文献 |
作者简介与研究成果 |
致谢 |
(6)基于情感关系模式和注意力检测的多媒体情感分析(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 对抗学习的研究现状 |
1.2.2 图卷积网络的研究现状 |
1.2.3 注意力机制的研究现状 |
1.2.4 多媒体情感标注的研究现状 |
1.2.5 图像情感分析研究现状 |
1.3 主要研究内容 |
1.4 论文组织结构 |
第2章 基于情感关系模式的多媒体情感标注算法 |
2.1 引言 |
2.2 知识背景: 图卷积网络 |
2.3 知识背景: 生成对抗网络 |
2.4 问题描述 |
2.5 基于情感关系模式的多媒体情感标注算法 |
2.5.1 特征层的局部关系注入 |
2.5.2 标签层的全局关系约束 |
2.5.3 类平衡损失函数设计 |
2.6 实验与分析 |
2.6.1 实验条件 |
2.6.2 实验结果与分析 |
2.6.3 与相关工作的比较 |
2.6.4 类平衡损失函数对实验结果的影响 |
2.6.5 不同深度的图卷积网络对实验结果的影响 |
2.6.6 挑选编码器不同层特征的影响 |
2.7 本章小结 |
第3章 基于注意力检测和关系建模的图像情感分布算法 |
3.1 引言 |
3.2 基于注意力检测和关系建模的图像情感分布算法 |
3.2.1 类情感注意力检测 |
3.2.2 相关性分析 |
3.2.3 全局情感注意力生成 |
3.3 实验与分析 |
3.3.1 实验条件 |
3.3.2 与相关工作的比较 |
3.3.3 可视化结果分析 |
3.4 消融实验与分析 |
3.4.1 算法中不同模块的作用 |
3.4.2 不同词向量策略的影响 |
3.4.3 双线性池化函数中参数的影响 |
3.4.4 损失函数中权衡参数的影响 |
3.4.5 不同深度的图卷积网络的影响 |
3.4.6 不同特征融合策略的影响 |
3.4.7 模型信息 |
3.5 本章小结 |
第4章 总结与展望 |
4.1 本文工作总结 |
4.2 下一步工作展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(7)跨模态哈希学习算法及其应用研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与研究意义 |
1.2 国内外研究现状 |
1.2.1 哈希的概述 |
1.2.2 单模态哈希方法的概述 |
1.2.3 跨模态哈希方法的概述 |
1.3 本文使用的数据集 |
1.4 论文的主要研究内容及章节安排 |
第二章 相关准备知识 |
2.1 迭代量化学习方法 |
2.2 离散优化学习方法 |
2.3 流形保持学习方法 |
2.4 半配对离散哈希方法 |
2.5 线上哈希学习方法 |
第三章 基于矩阵分解的哈希编码学习模型 |
3.1 引言 |
3.2 基于矩阵分解的跨模态监督哈希模型 |
3.2.1 符号表示及问题描述 |
3.2.2 公共子空间学习 |
3.2.3 分类器学习 |
3.2.4 类属性学习 |
3.2.5 总体目标函数 |
3.2.6 优化过程 |
3.3 实验结果与分析 |
3.3.1 实验数据 |
3.3.2 实验设置 |
3.3.3 对比方法介绍 |
3.3.4 对比实验结果 |
3.3.5 参数敏感性分析 |
3.3.6 消融实验结果 |
3.3.7 算法的收敛性与时间复杂度 |
3.4 本章小结 |
第四章 基于多种视图特征的哈希编码学习模型 |
4.1 引言 |
4.2 基于多种视图特征的跨模态监督哈希模型 |
4.2.1 符号表示 |
4.2.2 多种视图特征 |
4.2.3 核化操作 |
4.2.4 哈希编码学习 |
4.2.5 总的目标函数 |
4.2.6 优化过程 |
4.3 实验结果和分析 |
4.3.1 实验数据 |
4.3.2 实验设置 |
4.3.3 对比实验结果 |
4.3.4 消融实验结果 |
4.3.5 参数敏感性分析 |
4.3.6 算法的收敛性与时间复杂度 |
4.4 本章小结 |
第五章 基于Hadamard矩阵的线上哈希编码学习模型 |
5.1 引言 |
5.2 自适应的线上跨模态融合哈希模型 |
5.2.1 问题描述 |
5.2.2 Hadamard矩阵的定义 |
5.2.3 线下学习阶段 |
5.2.4 带有动态权值的线上搜寻过程 |
5.3 实验结果和分析 |
5.3.1 实验数据 |
5.3.2 实验设置 |
5.3.3 对比实验结果 |
5.3.4 消融实验结果 |
5.3.5 算法的运行时间和结果分析 |
5.3.6 参数敏感性分析和算法的收敛性 |
5.4 本章小结 |
第六章 基于标签传播的半配对哈希编码学习模型 |
6.1 引言 |
6.2 跨模态半配对哈希模型 |
6.2.1 符号表示与问题陈述 |
6.2.2 标签传播 |
6.2.3 分类器学习 |
6.2.4 总的目标函数 |
6.2.5 优化过程 |
6.2.6 量化学习 |
6.3 实验结果和分析 |
6.3.1 实验数据 |
6.3.2 对比实验结果 |
6.3.3 消融实验结果 |
6.3.4 参数敏感性分析 |
6.3.5 算法的收敛性 |
6.4 本章小结 |
第七章 基于多模态图嵌入的无监督哈希编码学习模型 |
7.1 引言 |
7.2 基于多模态图嵌入的跨模态无监督哈希模型 |
7.2.1 问题阐述 |
7.2.2 图嵌入模型 |
7.2.3 哈希函数学习 |
7.2.4 总的目标函数 |
7.2.5 优化过程 |
7.3 实验结果和分析 |
7.3.1 实验数据 |
7.3.2 实验设置 |
7.3.3 对比实验结果 |
7.3.4 消融实验结果 |
7.3.5 参数敏感性分析 |
7.4 本章小结 |
第八章 总结与展望 |
8.1 全文总结 |
8.2 展望 |
致谢 |
参考文献 |
附录:攻读博士期间发表的论文 |
(8)用户性格分析与个性化图像美学评价研究(论文提纲范文)
致谢 |
摘要 |
abstract |
缩略词表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 研究现状及问题分析 |
1.3 主要研究内容与组织结构 |
2 基于场景感知概率的用户性格特征预测 |
2.1 引言 |
2.2 用户性格特征预测模型 |
2.3 实验结果与分析 |
2.4 本章小结 |
3 基于弱监督双卷积网络的用户性格特征预测 |
3.1 引言 |
3.2 基于弱监督学习的用户性格特征预测模型 |
3.3 实验结果与分析 |
3.4 本章小结 |
4 基于性格辅助多任务学习的个性化图像美学评价 |
4.1 引言 |
4.2 基于性格辅助多任务学习的图像美学评价模型 |
4.3 实验结果与分析 |
4.4 本章小结 |
5 基于梯度优化元学习的个性化图像美学评价 |
5.1 引言 |
5.2 基于梯度优化元学习的个性化图像美学评价模型 |
5.3 实验结果与分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(9)分布式移动网络环境下大规模空间社交媒体数据快速增强现实可视化研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.1.1 增强现实技术 |
1.1.2 大数据特征 |
1.2 研究现状综述 |
1.2.1 户外增强现实技术 |
1.2.2 增强现实地图研究 |
1.2.3 相关研究进展分析 |
1.3 研究内容与技术路线 |
1.3.1 研究内容与关键问题 |
1.3.2 研究思路与技术路线 |
1.3.3 论文组织结构 |
第2章 空间社交媒体数据存储规范 |
2.1 大规模空间社交媒体数据存储方案 |
2.1.1 关系型空间数据存储方案 |
2.1.2 分布式NoSQL数据存储 |
2.2 空间社交媒体数据NoSQL表达 |
2.2.1 空间数据的JSON表达 |
2.2.2 社交媒体数据的空间描述 |
2.3 典型空间社交媒体数据存储规范 |
2.3.1 文本数据类型存储规范 |
2.3.2 图像数据类型存储规范 |
2.3.3 音频数据类型存储规范 |
2.3.4 视频数据类型存储规范 |
2.3.5 三维模型数据类型存储规范 |
第3章 基于稳态Z曲线的空间社交媒体数据分布式存储 |
3.1 稳态Z曲线的编码构建 |
3.1.1 分布式数据库分片键值选择 |
3.1.2 空间数据划分的稳态Z曲线构建 |
3.2 基于稳态Z曲线的常见空间查询 |
3.2.1 K最近邻查询 |
3.2.2 点线面空间查询 |
3.3 基于稳态Z曲线的负载均衡划分方法 |
3.3.1 负载均衡数据划分方法 |
3.3.2 实验结果对比分析 |
第4章 移动增强现实前端可视化空间构建 |
4.1 空间社交媒体可视化空间 |
4.1.1 移动增强现实坐标系统 |
4.1.2 移动增强现实前端可视化空间构建 |
4.1.3 移动增强现实三层可视化空间 |
4.2 基于卡尔曼滤波的球面三维注册 |
4.2.1 空间社交媒体数据的球面投影 |
4.2.2 基于卡尔曼滤波算法相机姿态修正 |
4.3 大规模社交图片检索时空耦合算法 |
4.3.1 基于图像自然特征的增强现实可视化空间 |
4.3.2 社交图片搜索的时空耦合算法原理描述 |
4.3.3 图像检索算法测试案例 |
第5章 空间社交媒体数据增强现实多级缓存机制 |
5.1 增强现实多级缓存架构 |
5.1.1 分布式高速读写与高并发访问问题 |
5.1.2 增强现实多级缓存架构体系 |
5.2 基于空间邻近性的增强现实缓存管理 |
5.2.1 常见缓存管理策略问题分析 |
5.2.2 基于空间邻近性的缓存预调度策略 |
5.2.3 增强现实缓存策略试验与分析 |
5.3 增强现实云端热点探测与缓存调度 |
5.3.1 局部热点数据探测与缓存调度 |
5.3.2 云端缓存命中率测试与分析 |
第6章 大规模空间社交媒体数据并行处理框架 |
6.1 大数据时代的计算特征 |
6.1.1 大数据技术 |
6.1.2 云计算技术 |
6.1.3 高性能计算 |
6.2 大规模空间社交媒体数据并行计算方法 |
6.2.1 并行计算算法代数假设 |
6.2.2 并行计算算法代数定义 |
6.2.3 并行计算算法代数运算谓词 |
6.3 大规模空间社交媒体数据并行计算架构 |
6.3.1 空间社交媒体数据并行计算框架 |
6.3.2 计算任务主从并行调度模式 |
6.3.3 空间社交媒体数据并行处理实例 |
第7章 原型系统设计与实现 |
7.1 移动增强现实原型系统 |
7.1.1 原型系统概述 |
7.1.2 前后端架构设计 |
7.2 原型系统空间界面交互设计 |
7.2.1 增强现实人机交互设计 |
7.2.2 空间社交媒体数据界面设计 |
7.3 原型系统增强现实可视化测试 |
7.3.1 增强现实可视化效果演示 |
7.3.2 原型系统性能测试 |
第8章 结论与展望 |
8.1 研究结论 |
8.2 研究创新点 |
8.3 前景展望 |
参考文献 |
已发表的研究成果 |
致谢 |
四、多媒体数据库管理的数据表示模型与融合(论文参考文献)
- [1]基于支持向量机的视频元数据信息快速检索方法[J]. 李超. 太原师范学院学报(自然科学版), 2021(04)
- [2]基于异构神经网络的音频舆情分析系统研究与实现[D]. 姜海坤. 北京邮电大学, 2021(01)
- [3]多源图像及视频感知质量评价方法研究[D]. 周玮. 中国科学技术大学, 2021(09)
- [4]任务型对话系统开发平台的设计与实现[D]. 韦帅丽. 北京邮电大学, 2021(01)
- [5]数字人文视域下口述历史档案资源知识发现研究[D]. 王阮. 吉林大学, 2021
- [6]基于情感关系模式和注意力检测的多媒体情感分析[D]. 徐志伟. 中国科学技术大学, 2021(08)
- [7]跨模态哈希学习算法及其应用研究[D]. 庾骏. 江南大学, 2020
- [8]用户性格分析与个性化图像美学评价研究[D]. 祝汉城. 中国矿业大学, 2020(07)
- [9]分布式移动网络环境下大规模空间社交媒体数据快速增强现实可视化研究[D]. 张帅. 南京大学, 2020(10)
- [10]教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知[J]. 教育部. 中华人民共和国教育部公报, 2020(06)