以文本方式查看主题

-  W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  到底ontology有什么用  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=9882)


--  作者:songlz
--  发布时间:9/10/2004 11:03:00 AM

--  到底ontology有什么用
近日和朋友谈论所做课题,问我在做什么,我说本体,就是ontology,朋友惊呼,很高深的样子,问我用这个做有什么好处,呵呵,我说可以提供很多语义层面的信息,朋友让我用检索为例说明有什么先进之处,唉,我只会说,比如你想查询计算机方面的资料,那么包含电脑的也可以被检索到,其他的就说不出来了。
大家教教我,以后这种情况,如何举出1,2,3,。。。好处啊。

到底本体有什么用啊?


--  作者:orangebench
--  发布时间:9/10/2004 11:09:00 AM

--  
呵呵,好问题,呼唤micky ;-)

你的例子实在不怎样 ;-)很早以前就有做query expansion,解决“查计算机,电脑的资料也出来“的问题。


--  作者:saleemlz
--  发布时间:9/10/2004 11:32:00 AM

--  
"查计算机,电脑的资料也出来“这个问题,google,baidu,她们现在都已经做到了.
语义检索的先进之处,我觉得,是解决语义的一致性问题.
大家对同一事物有不同表达方式,不同的表达语言,以及不同的表述形式.
传统的的检索方式,只是简单的文本匹配;现在google,baidu,可能是添加了同义词表,所以检索的性能比以前提高了很多.
语义检索,现在大家都聚焦在概念检索这一点上.通过概念检索,可以使得检索的准确率及回召率提高,但是我认为,概念检索的前提条件是,要求以本体作为数据存储的框架.这样的话,建设一个perfect本体成为首要问题
--  作者:orangebench
--  发布时间:9/10/2004 11:35:00 AM

--  
呵呵,向别人吹牛可以用你的说法了,但感觉还不够通俗 ;-)
以下是引用saleemlz在2004-9-10 11:32:44的发言:
"查计算机,电脑的资料也出来“这个问题,google,baidu,她们现在都已经做到了.
语义检索的先进之处,我觉得,是解决语义的一致性问题.
大家对同一事物有不同表达方式,不同的表达语言,以及不同的表述形式.
传统的的检索方式,只是简单的文本匹配;现在google,baidu,可能是添加了同义词表,所以检索的性能比以前提高了很多.
语义检索,现在大家都聚焦在概念检索这一点上.通过概念检索,可以使得检索的准确率及回召率提高,但是我认为,概念检索的前提条件是,要求以本体作为数据存储的框架.这样的话,建设一个perfect本体成为首要问题


--  作者:songlz
--  发布时间:9/10/2004 2:16:00 PM

--  
对呀,我也觉得和别人说概念什么的有点虚,那概念检索和关键词检索到底有什么区别,如果仅仅是说同义词,就像orangebench所说,查询扩展就可以了,概念的其他关系,查询扩展也可以做到的阿?
--  作者:monbit
--  发布时间:9/10/2004 4:42:00 PM

--  
但是概念是由它的属性集来表达的,比如,“人”这个概念,可能就是由“能直立行走”和“有语言”这两个属性定义出来。“人”本身是这个概念的名字,以前的检索方法就是检索的这个名字,也就是关键字的方法,就会有很多不确切的地方。而本体可以表达概念的属性,这样,在这个例子中即使“人”这个名称换成了“月亮”,说“月亮”“能直立行走”,并且“有语言”,那么计算机理解起来还是和“人”这个概念是相同的,因为基于本体的检索是基于概念的,而概念是由其属性集表达的,与具体的概念名称是什么无关。不知道这么说,大家容易不容易理解?
--  作者:songlz
--  发布时间:9/11/2004 10:08:00 AM

--  
楼上这么说的话,那本体中的关系和公理作用是什么呢?是推导属性?
--  作者:monbit
--  发布时间:9/11/2004 2:10:00 PM

--  
关系当然是定义概念间的关系以及概念的属性间的关系,让各个概念联系起来,才能形成一个语义网阿,呵呵。
公理的作用我个人理解就是约束本体的定义,因为本体是一个领域相关的东东,就必然会有领域相关的约束,本体是不能凭空定义而没有约束的。
--  作者:songlz
--  发布时间:9/12/2004 10:18:00 AM

--  
是否可以这样说,本体是基于概念表达的,提供服务(比如检索)的过程就是概念匹配的过程,而概念是由其属性集表达的,所以检索的过程是匹配属性集的过程(可以这么说吗?),而不单单是概念本身的名字的匹配,所以提供服务更精确。

--  作者:songlz
--  发布时间:9/12/2004 10:38:00 AM

--  
这么看来基于概念的检索比基于关键词的方法,检索的结果集要小得多了?
除了由于同义词的存在使得结果集增加的部分
--  作者:songlz
--  发布时间:9/12/2004 10:44:00 AM

--  
“人”这个概念的例子不错
但是我觉得太普通了点,象这样主体的东西的属性比较好定义,如人,动物等
但是其他的, 信息中的概念,比如“数据库”,"人工智能",“图书馆学”等的属性,我就不知道从何下手了。
--  作者:monbit
--  发布时间:9/13/2004 4:37:00 PM

--  
基本上应该是这样的吧。另外,对属性集的匹配其实是可以通过定义规则来实现的,因为属性都有属性值,其实就是去比较属性值,而如何比较属性值可以通过定义推理规则来实现,这样就有可能描述个人兴趣或者领域相关的规则,得到更精确的结果集。这样的结果集可能会小,也可能会包含以前没有查到的检索结果,因此也不一定就一定小,只是更精确了(即该查到的都查到,查到的都是需要的,recall和precision都要高)。
--  作者:monbit
--  发布时间:9/13/2004 4:40:00 PM

--  
你怎么会去定义“数据库”的属性呢?这是在什么领域定义的?
--  作者:monbit
--  发布时间:9/13/2004 4:42:00 PM

--  
我引用一个本体的官方定义:“An ontology is an explicit, formal specification of a shared conceptualization of a domain of interest”
里面的explicit、formal、shared、conceptualization、domain都是关键字,说明本体是一个“共享概念模型的明确的形式化规范说明”。对于这个定义的理解我们还可以深入讨论。
--  作者:happysw
--  发布时间:9/13/2004 6:16:00 PM

--  
以下是引用monbit在2004-9-13 16:37:42的发言:
基本上应该是这样的吧。另外,对属性集的匹配其实是可以通过定义规则来实现的,因为属性都有属性值,其实就是去比较属性值,而如何比较属性值可以通过定义推理规则来实现,这样就有可能描述个人兴趣或者领域相关的规则,得到更精确的结果集。这样的结果集可能会小,也可能会包含以前没有查到的检索结果,因此也不一定就一定小,只是更精确了(即该查到的都查到,查到的都是需要的,recall和precision都要高)。

如果这样说,你的搜索引擎是怎么建立的?用户仅输入一个关键词,你怎么知道他要表达什么内容?难道要再输入一些属性之类的?是不是要在搜索引擎的界面里面表示?
还有,你的页面索引是怎么做的?爬来的页面,里面的各种关键词,你是怎么处理的呢?


--  作者:songlz
--  发布时间:9/13/2004 9:33:00 PM

--  
我觉得在信息检索领域,象“数据库”,“人工智能”是最容易出现的吧,因为大家查资料可能会需要,我是想做数字图书馆领域中的,但是涉及的概念非常广泛,还不如其他领域具体,比如,金融,农业,林业等。我举的这几个概念应该算是计算机技术领域,呵呵,我这样的区分领域合适吗?
--  作者:songlz
--  发布时间:9/14/2004 11:21:00 AM

--  
大家能否举出一个属性匹配的具体例子
说明其精确性
--  作者:zhsail
--  发布时间:9/16/2004 12:35:00 PM

--  
请教个菜鸟问题: 领域是什么东东,怎么来的?
                        什么叫领域阿,领域到底有多大?数字图书馆领域?!
--  作者:jhqhui
--  发布时间:9/16/2004 3:43:00 PM

--  
XML和RDF在处理语义上存在一词多义和同一概念多种表示的问题,而本体通过对概念进行严格定义和概念间的关系来确定概念的精确含义。而且本体里可以实现推理
--  作者:monbit
--  发布时间:9/16/2004 11:49:00 PM

--  
“数据库”、“人工智能”这样的概念我还真的没考虑过,至于他们是不是本体所能表达的概念我也不好说。而且,让人感觉这两个概念也不是同一层面的东西啊,你在“人工智能”里面肯定要用到“数据库”,而“数据库”也可以在其他地方使用。我觉得,“数据库”更像是一个具体的技术,“人工智能”则应该被称为领域,一般可以说“人工智能领域”。另外,我纠正你一个比较关键的问题,就是,不是说“数据库”这三个字在信息检索领域出现得比较频繁,他就一定是一个本体可以表达的概念,这三个字其实也只是关键字而已么。总之,我们对概念的理解还应该再深入讨论一下!
--  作者:monbit
--  发布时间:9/16/2004 11:53:00 PM

--  
to zhsail:领域实际上就是一部分世界,a part of the whole world
至于你怎么去定义一个领域,一个领域有多大,我也不知道有什么官方的定义。
比如我现在搞旅游领域,这个领域确实被界定的很明确,别的领域没仔细研究过,欢迎大家讨论!
--  作者:songlz
--  发布时间:9/17/2004 8:49:00 AM

--  
谢谢monbit!
那么在信息检索中,我们应该定义一些什么样的本体呢?
像那些关键词怎么表现呢?
--  作者:fengyun
--  发布时间:9/21/2004 3:04:00 PM

--  
也许不一定。
正如saleemlz所说,在不同的领域里,同一事物有不同表达方式,不同的表达语言,以及不同的表述形式。
采用本体,可以使不同领域里以不同表达方式或表述形式描述的同类事物均被查到,那么检索的结果也许会多于没采用本体的检索。
欢迎指正!
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
105.469ms