以文本方式查看主题 - W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL (http://bbs.xml.org.cn/index.asp) -- 『 Web挖掘技术 』 (http://bbs.xml.org.cn/list.asp?boardid=69) ---- 多媒体信息中基于内容的检索[转帖] (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=48140) |
-- 作者:DMman -- 发布时间:6/7/2007 11:14:00 AM -- 多媒体信息中基于内容的检索[转帖] 郝小花(西南师范大学计算机科学系 重庆 400715) Abstract The basic concept of contentbased retrieval(CBR)system as well Keywords Multimedia\ Retrieval method/Content based retrieval 0 概述 所谓基于内容的检索(CBR)就是根据媒体和媒体对象的内容语义及上下文联系进行检 基于内容的检索有如下特点: (1)从媒体内容中提取信息线索。基于内容的检索直接对图像、视频、音频内容进行 (2)基于内容的检索是一种近似匹配。CBR采用相似性匹配的方法逐步求精,以获得查 (3)大型数据库的快速检索。多媒体数据库不仅数据量巨大,而且种类和数量繁多, CBR不仅是基于内容,而且是一种信息检索技术。它从认知科学、用户模型、图像处 CBR技术是一项实用的高技术,主要应用于以下几个方面:将基于内容检索引擎嵌入 1 系统结构 1.1 系统构成 完整的CBR系统一般由两个子系统构成,即数据库生成子系统和查询子系统。每个子 (1)对象标识。为用户提供一种工具,以全自动或半自动方式对静态图像、视频镜头 (2)特征提取。对视频、图像等多媒体数据自动或半自动地提取用户感兴趣的、适合 (3)数据库。由媒体库、特征库和知识库组成。媒体库包含多媒体数据,如图像、视 (5)搜索引擎。搜索是利用特征之间的距离函数来进行相似性匹配,模仿人类认知过 (6)索引/过滤器。搜索引擎通过索引/过滤机制来达到快速搜索的目的,从而可以 1.2 基于内容的查询和检索过程 基于内容的查询和检索是一个逐步求精的过程,检索经历了一个特征调整、重新匹配 (1)初始查询说明。用户查找一个对象时,最初可以用QBE或查询语言来形成一个查询 (2)相似性匹配。将查询特征与特征库中的特征按照一定的匹配算法进行相似匹配。 (3)满足一定相似性条件的一组候选结果,按相似度大小排列后返回给用户。 (4)特征调整。系统返回的查询结果用户可以挑选,直至得到满意的结果。或者从候 (5)逐步缩小查询范围,直到用户对查询结果满意为止。 2 多媒体数据基于内容查询 2.1 提交查询的方式 多媒体数据的结构化描述可以分为人工输入的特征描述和计算机自动或半自动抽取特 综合查询也需要对客观属性描述。与常规数据库的结构查询相似,这时检索是基于属 当用户表达不清楚检索要求或不熟悉媒体中的信息结构及类型时,则需要先浏览。通 CBR向用户提供直观的图形查询界面。主要用以下两种形式提交查询说明,这两种形 (1)示例查询说明。用户通过例子来表达查询要求。用户可以从系统提供的示例模板 (2)表格说明。用户往往难以描述一种较为复杂的查询要求。在这种情况下,系统向 2.2 查询类型 (1)图像查询。主要依据图像的颜色、纹理、形状特征,以及图像中子图像的特征进 (2)视频浏览和检索。视频可用场景、镜头、帧来描述。帧是一幅静态的图像,是组 基于关键帧的检索,是对代表视频镜头的关键帧进行检索。关键帧是一幅幅图像,可 基于运动的检索,是基于镜头和视频对象的时间特征来检索,是视频查询的进一步要 (3)声音查询。利用声学的和主观的特性进行查询。声音的一些感知特性,如音调、 (4)图形查询。基于空间的约束关系进行查询。包括:点查询,查找某坐标处的目标 (5)文本查询。以往文本资料的检索是利用关键词,采用传统的数据库技术来实现管 2.3 索引和过滤 数据库中包含成千上万的图像、视频和文本数据,为了有效地查询,适宜的存取结构 索引是对特征库的快速访问。对于数据库中的每个数据项,索引项包含关键属性值以 从宏观上看,索引可分级以加快数据访问。索引级的最高层是总目,下级是逐步缩小 从应用的不同要求上考虑,索引可以分类向用户提供不同的检索方法。如在一个视频 过滤是用快速计算的过滤器扫描数据库中的所有特征数据,只有通过了过滤器的项才 3 有待研究的关键技术 3.1 数据模型 数据模型是CBR系统的核心,决定CBR支持的查询类型和检索能力。建立的数据模型要 3.2 特征提取和语义获取 需要易用的能对原始特征进行抽取的自动工具和获取逻辑特征的半自动工具用于开发 3.3 基于内容的编码 我们使用的媒体,其格式和编码没有考虑到内容,只是针对颜色、象素、样值来编码 3.4 查询说明模式 对于特定类型的查询,该领域专家可能宁愿需要一种功能丰富的复杂的图形接口,以 3.5 索引和性能 研究适合于大型多媒体库检索的索引结构和过滤器,缩短系统的响应时间,提高查询 3.6 集成查询 用基于内容的查询补充和扩展已存在的数据库查询及信息存取方法。应用系统应能把 3.7 扩展性和灵活性 系统的体系结构应该支持更新与扩充新的特征表示和新的匹配/相似性度量算法,以 参考文献 1 冯玉才.多媒体数据库的研究动态及关键技术.多媒体世界,1996,(7) 2 陈海军,等.多媒体技术及应用系统制作.北京:北京师范大学出版社,1994. 3 何光辉.全文信息检索系统.多媒体世界,1996,(10) |
-- 作者:timothy -- 发布时间:7/30/2007 8:49:00 PM -- 不错,还有别的关于国内外进展的资料没有!? 希望能提供更多的资料! |
W 3 C h i n a ( since 2003 ) 旗 下 站 点 苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》 |
46.875ms |