一、一种新的基于模糊聚类的镜头检索方法(论文文献综述)
葛钊[1](2019)在《基于网络用户视频的摘要技术研究》文中进行了进一步梳理视频内容作为多媒体信息的载体之一不断被普遍应用在日常生活的方方面面。近些年来,随着移动电话和其他面向消费者的相机设备的普及,以及多媒体和互联网技术的高速发展,视频内容数量特别是网络用户视频的数量持续增长,这些海量的视频数据给人们理解新颖事物带来方便的同时也给视频存储,传输,检索等带来庞大的压力。而且由于视频内容的错综复杂,观众在浏览视频时会耗费大量的时间去寻找自己真正感兴趣的内容。技术正是基于这样的背景和需求而被提出来的。所谓视频摘要,就是以简略的内容概括原始视频的主要内容,一般分为静态的摘要和动态的摘要,静态的摘要从原始视频帧序列中抽取一些具有代表性的关键帧以生成摘要,而动态的摘要是由原始视频的一些视频片段组成。相对于动态视频摘要而言,静态视频摘要不受视频时序的约束,故形式更加直观且灵活。本文主要研究的摘要形式便是静态视频摘要。本文的主要创新点和成果如下:1.静态视频摘要的生成可以分为两大步骤,第一步就是视频的分段处理,第二步基于分段的结果在每段中进行关键帧的提取。本文首先在视频的分段处理上与传统的采样方法不同,针对网络用户视频提出了一种基于视频运动信息的自适应分段方法。2.针对视频摘要的传统算法,如聚类方法,图模型方法,在此基础上结合并优化,提出了一种新的基于最短路径算法的静态视频摘要方法(Shortest Path for Video Summary,SPVS)。SPVS方法将视频摘要的关键帧提取问题转化为有向图的最短路径求解问题,通过相似性度量找到的最短路径上的关键帧具有良好的代表性。3.由于传统的视频摘要方法所用到的特征大多是一些低维度的图片特征如颜色和纹理特征,随着机器学习和相关神经网络的发展,一些网络已经可以很轻易的提取出图片的深度的高维度特征,这些特征相对于低维度特征而言更具有代表性。而同时一些先进的神经网络的提出也为视频摘要技术提供了新的可能性。本文提出一种改进的生成对抗网络模型,通过生成对抗网络中生成器和判别器的博弈对抗对视频摘要生成过程进行学习,不断优化目标函数最后确定生成的摘要内容。
章毓晋[2](2010)在《中国图像工程:2009》文中研究表明该文是关于中国图像工程的年度文献综述系列之十五。为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,并能够方便地查询有关文献,现从2009年在国内15种有关图像工程重要中文期刊的共134期上发表的3604篇学术研究和技术应用文献中,选取出1008篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理,图像分析,图像理解,技术应用和综述五个大类,然后进一步分入23个专业小类(与去年相同)。在此基础上还进行了各期刊各类文献的统计和分析。根据统计分析结果可看到我国图像工程在2009年许多新进展的情况。特别值得指出,在上述15种期刊上所发表的图像工程文献数量在2009年继续增加并达到历史最高,显示了图像工程在中国继续蓬勃发展的趋势。另外,借此综述系列15年之际,还将这15年分成3个5年的阶段,分别对3个阶段的图像工程文献选取情况和各类图像工程文献数量进行了统计和对比分析,以为读者提供更全面和可信的发展动态信息。
蒋鹏[3](2009)在《基于语义的视频内容提取与分析关键技术研究》文中提出近些年来,随着多媒体技术和网络技术的快速发展,出现大量的以视频为主的多媒体数据。如何有效的处理这些海量的视频数据是目前一个研究的热点问题。其中“语义鸿沟”是人与计算机系统交互中的一个重要障碍,这是由于人对视觉媒体的评判标准和计算机系统对视觉媒体的评判标准存在着很大差异。由于计算机系统通常利用颜色、纹理和形状等底层特征进行视频结构分析,然而人们更倾向于利用内容以及语义级别的检索方式进行视频检索。如何减少计算机系统和人类之间的“语义鸿沟”是目前基于内容的视频检索等领域的一个重要突破点。其中视频内容的提取与检索就是解决“语义鸿沟”的重要手段。虽然对于基于内容的视频检索有了很多研究,但这项技术还远远不能满足用户的普遍需求。本文对基于语义的视频内容提取与分析的几个关键技术进行了研究,研究主要集中于如何自动提取与分析视频内容,实现视频数据的半自动或自动分析和归类,以满足检索的需要。本文分析了传统三层内容分析架构的不足。在此基础上,提出了四层内容分析架构:基本视觉内容层、感知内容层、目标内容层以及场景内容层。通过增加的感知内容层可以更好的解决计算机系统与人类之间的“语义鸿沟”问题。本文的主要研究成果包括:(1)在视觉感知内容层面,重点研究了基于视觉注意模型的感知内容提取模型,并在此基础上提出了动态场景下的视觉显着图生成方法(Salient Map Generation on Dynamic Scene, SMGDS )以及基于时空模型的快速视觉显着图生成方法(Salient Map Generation using Temporal-Spatial Model, SMGTSM)。SMGDS算法通过运动轨迹等运动特征实现了动态场景下的视觉显着图的稳定生成。而SMGTSM则利用一种无监督聚类算法实现了视觉显着图的实时生成。通过SMGDS和SMGTSM有效地实现了视频感知内容的提取,为感知内容层提取奠定了基础。(2)在目标内容层面上,着重于监控视频的目标提取。分别提出了复杂背景下的自适应前景分割算法(Adaptive Foreground Segmentation in Dynamic Scene, AFSDS)和利用背景聚类的快速前景分割算法(Fast Foreground Segmentation using Background Clustering, FFSBC)。在分析了现有基于高斯混合模型前景分割算法的缺陷后,AFSDS和FFSBC算法分别在目标检测精度和速度两个方法对现有的高斯混合模型(MOG)算法进行了改进。实验证明AFSDS和FFSBC可以在复杂场景下有效地检测出运动前景,显着地提高了检测精度和速度。(3)在分析了具体场景特点的基础上,提出了针对故事片中出现的人物自动索引算法(Automatic People Indexing in Video, APIV)。APIV算法首先用人脸检测算法检测出视频出现的人物,再提取衣着颜色和声音两种特征构成特征向量,最后通过提出的新的无监督聚类算法实现了视频中出现的人物的自动聚类。APIV算法解决了传统方法中需要靠人工对视频中出现人物进行手工标注的问题,能够自动的对视频中出现的人物进行聚类。对于大量的视频进行实验,实验证明了APIV算法的有效性和实用性。APIV为现有场景内容分析方法提供了一种有效的补充。(4)视频摘要是视频内容的压缩和摘要。在分析了现有视频摘要生成方法的不足的基础上,提出一种基于视觉感知内容的视频摘要生成方法(Key-frame Extraction using Visual Attention Model in Video, KEVAMV)。KEVAMV算法利用了视觉注意模型,提取了视觉注意度(Visual Attention Index, VAI)作为特征,并根据VAI的变化自动生成优化的视频摘要。KEVAMV方法相对传统方法而言,可以根据人的视觉特点,提取用户较为感兴趣的关键帧。本文的研究是基于目前用户对视频内容分析的迫切应用需求和广泛的应用前景展开的。主要研究了视频内容提取与检索的关键技术,从而用户可以简单而有效地获取感兴趣的视频内容。
章毓晋[4](2009)在《中国图像工程:2008》文中研究说明该文是关于中国图像工程的年度文献综述系列之十四。为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,并能够方便地查询有关文献,现从2008年在国内15种有关图像工程重要中文期刊的共120期上发表的3359篇学术研究和技术应用文献中,选取出915篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理,图像分析,图像理解,技术应用和综述5个大类,然后进一步分入23个专业小类(与去年相同)。在此基础上还进行了各期刊各类文献的统计和分析。根据统计分析结果可看到,我国图像工程在2008年许多新进展的情况。特别值得指出的是,在上述15种期刊上所发表的图像工程文献数量在2008年继续增加并达到历史最高,显示了图像工程在中国继续蓬勃发展的趋势。
章毓晋[5](2008)在《中国图像工程:2007》文中研究表明该文是关于中国图像工程的年度文献综述系列之十三。为了使国内广大从事图像工程研究和图像技术应用的科技人员能够较全面地了解国内图像工程研究和发展的现状,并能够方便地查询有关文献,现从2007年在国内15种有关图像工程重要中文期刊的共118期上发表的3312篇学术研究和技术应用文献中,选取出895篇属于图像工程领域的文献,并根据各文献的主要内容将其分别归入图像处理、图像分析、图像理解、技术应用和综述5个大类,然后进一步分入23个专业小类(与去年相同)。在此基础上还进行了各期刊各类文献的统计和分析。根据统计分析结果可看到我国图像工程在2007年许多新进展的情况。特别值得指出,在上述15种期刊上所发表的图像工程文献数量在2007年有大幅增加并达到历史最高,显示了图像工程研究在中国继续发展的趋势。
董庆杰,彭宇新,郭宗明,肖建国[6](2004)在《一种新的基于模糊聚类的镜头检索方法》文中研究表明镜头检索是基于内容的视频检索的重要内容,而镜头内部内容往往是变化的,这给镜头检索带来了很大的困难。为了描述这种镜头内部的不一致性,这里首次使用模糊聚类的方法,把镜头分为多个等价类,等价类内部内容是一致的,这些等价类客观全面地描述了镜头内部内容的变化。把这些等价类用于镜头检索,获得了良好的检索结果。实验对比结果也证实了该方法的有效性。
二、一种新的基于模糊聚类的镜头检索方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种新的基于模糊聚类的镜头检索方法(论文提纲范文)
(1)基于网络用户视频的摘要技术研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 课题背景和意义 |
1.2 国内外研究现状 |
1.3 本文的主要工作和结构安排 |
1.3.1 本文的主要工作 |
1.3.2 章节安排 |
第二章 静态视频摘要的基本概念和方法 |
2.1 静态视频摘要的基本概念 |
2.2 静态视频摘要的典型方法 |
2.2.1 基于聚类的方法 |
2.2.2 基于图模型的方法 |
2.2.3 基于深度神经网络的方法 |
2.3 本章小结 |
第三章 基于最短路径的静态视频摘要方法 |
3.1 视频分段处理 |
3.1.1 常用的视频分段方法 |
3.1.2 基于运动信息的视频分段方法 |
3.2 基于最短路径的关键帧提取算法 |
3.2.1 提取特征和段内聚类 |
3.2.2 构建有向图 |
3.2.3 最短路径求解 |
3.3 实验结果和分析 |
3.3.1 Open-Video数据集实验 |
3.3.2 SumMe数据集实验 |
3.4 本章小结 |
第四章 基于生成对抗网络的静态视频摘要方法 |
4.1 自编码器模型 |
4.2 生成对抗网络模型 |
4.3 视频摘要网络模型 |
4.4 实验及结果分析 |
4.4.1 实验数据集及评价指标 |
4.4.2 实验分析与讨论 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 本文工作总结 |
5.2 未来工作展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(2)中国图像工程:2009(论文提纲范文)
0 引 言 |
1 综述目的 |
1) 概括我国图像工程发展现状 |
2) 便利从事图像工程研究和图像技术应用的人员查阅有关文献 |
3) 提供期刊编者和文献作者有用的参考信息 |
2 刊物选取 |
3 文献选取和分类 |
4 文献分类统计结果和讨论 |
4.1 15年图像工程文献选取和分类概况比较 |
4.2 2009年各刊图像工程文献刊载情况 |
4.3 2009年各刊图像工程文献详细分类情况 |
5 前后3个5年的比较 |
6 结 论 |
(3)基于语义的视频内容提取与分析关键技术研究(论文提纲范文)
摘要 |
Abstract |
图清单 |
表清单 |
注释表 |
第一章 绪论 |
1.1 视频数据的特点与视频检索研究的意义 |
1.2 视频内容提取与检索研究现状 |
1.3 视频内容提取与检索的应用领域 |
1.4 本文的主要工作、创新点 |
1.5 本论文的内容安排和组织结构 |
第二章 视频内容提取与检索相关技术与问题 |
2.1 视频内容检索的基本框架 |
2.2 视频结构分析 |
2.3 特征提取 |
2.3.1 静态特征和运动特征 |
2.3.2 底层特征和高级特征 |
2.4 视频对象提取 |
2.4.1 语义视频对象 |
2.4.2 语义对象的提取 |
2.5 视频摘要生成 |
2.6 浏览与检索 |
2.7 基于语义的视频检索模型 |
2.7.1 基于语义的内容层次模型 |
2.7.2 基于视觉显着区的四层内容模型 |
2.8 本章小结 |
第三章 基于视觉注意模型的感知内容提取 |
3.1 视觉注意机制 |
3.1.1 视觉注意机制的计算模型 |
3.1.2 视觉显着图 |
3.2 已有视觉显着图检测方法及其缺陷 |
3.3 一种动态场景中的视觉注意区域检测方法 |
3.3.1 轨迹的获取及其分类 |
3.3.2 基于轨迹分类的全局运动检测方法 |
3.3.3 运动显着区域生成 |
3.3.4 空间显着区域提取 |
3.3.5 运动优先的时空动态混合 |
3.3.6 实验结果及分析 |
3.4 基于时空模型的快速视频显着区域检测 |
3.4.1 运动显着区域快速生成 |
3.4.2 特征点运动轨迹的自适应模糊聚类 |
3.4.3 异常数据剔除 |
3.4.4 空间显着区域提取 |
3.4.5 运动优先的时空动态混合 |
3.4.6 实验结果及分析 |
3.5 本章小结 |
第四章 监控场景下的视频对象提取 |
4.1 监控场景中视频对象提取研究的意义 |
4.2 监控场景下视频对象提取的方法 |
4.3 复杂背景下的自适应前景分割算法 |
4.3.1 背景差法的回顾 |
4.3.2 时间域自适应背景模型 |
4.3.3 快速前景检测 |
4.3.4 自适应阈值估计 |
4.3.5 实验结果及分析 |
4.4 利用背景聚类的快速前景分割算法 |
4.4.1 基于时间域无监督聚类的背景模型 |
4.4.2 背景模型的自适应更新 |
4.4.3 实验结果及分析 |
4.5 本章小结 |
第五章 基于领域知识视频索引的研究 |
5.1 有监督标注和无监督标注 |
5.1.1 无监督标注的特点 |
5.2 常见视频类型以及查询特点 |
5.3 融合多特征和领域知识的视频人物索引方法 |
5.3.1 视频中人物索引的相关工作 |
5.3.2 多种特征融合的人物索引方法 |
5.3.3 预处理 |
5.3.4 镜头人物检测 |
5.3.5 人物衣着颜色特征 |
5.3.6 声音特征 |
5.3.7 人物聚类及其修正算法 |
5.3.8 实验结果及分析 |
5.4 本章小结 |
第六章 基于语义的视频摘要生成方法 |
6.1 基于关键帧提取的视频摘要方法 |
6.2 基于视觉注意模型的自适应视频关键帧提取方法 |
6.2.1 基于时空显着性的视觉注意度提取 |
6.2.2 基于运动优先的视觉注意度生成 |
6.2.3 基于视觉注意度的关键帧提取 |
6.2.4 实验结果及分析 |
6.3 本章小结 |
第七章 总结与展望 |
7.1 本文的主要研究工作及成果 |
7.2 不足以及下一步工作 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
(4)中国图像工程:2008(论文提纲范文)
1 引 言 |
2 综述目的 |
3 刊物选取 |
4 文献选取和分类 |
5 文献分类统计结果和讨论 |
5.1 14年图像工程文献选取和分类概况比较 |
5.2 2008年各刊图像工程文献刊载情况 |
5.3 2008年各刊图像工程文献详细分类情况 |
6 结 论 |
(5)中国图像工程:2007(论文提纲范文)
1 引 言 |
2 综述目的 |
3 刊物选取 |
4 文献选取和分类 |
5 文献分类统计结果和讨论 |
5.1 近13年图像工程文献选取和分类概况比较 |
5.2 2007年各刊图像工程文献刊载情况 |
5.3 2007年各刊图像工程文献详细分类情况 |
6 结 论 |
四、一种新的基于模糊聚类的镜头检索方法(论文参考文献)
- [1]基于网络用户视频的摘要技术研究[D]. 葛钊. 合肥工业大学, 2019(01)
- [2]中国图像工程:2009[J]. 章毓晋. 中国图象图形学报, 2010(05)
- [3]基于语义的视频内容提取与分析关键技术研究[D]. 蒋鹏. 南京航空航天大学, 2009(07)
- [4]中国图像工程:2008[J]. 章毓晋. 中国图象图形学报, 2009(05)
- [5]中国图像工程:2007[J]. 章毓晋. 中国图象图形学报, 2008(05)
- [6]一种新的基于模糊聚类的镜头检索方法[J]. 董庆杰,彭宇新,郭宗明,肖建国. 计算机工程与应用, 2004(01)