新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     >>W3CHINA.ORG讨论区<<     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWLW3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → [原创]Information Extraction和Information Retrieve的区别 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 21704 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [原创]Information Extraction和Information Retrieve的区别 举报  打印  推荐  IE收藏夹 
       本主题类别: 信息检索    
     MerryZhang 美女呀,离线,快来找我吧!
      
      
      威望:4
      头衔:CTO
      等级:计算机学士学位
      文章:442
      积分:2808
      门派:W3CHINA.ORG
      注册:2006/1/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给MerryZhang发送一个短消息 把MerryZhang加入好友 查看MerryZhang的个人资料 搜索MerryZhang在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看MerryZhang的博客楼主
    发贴心情 [原创]Information Extraction和Information Retrieve的区别

    Information Extraction(IE)和Information Retrieve(IR)虽然只差一个词,但是在Web和搜索中的意义和作用却是不一样的。
    IR通常是输入一些关键词,从而搜索出相关的文档。而IE则是搜索出相关的结果。采用IR,通常人们还需要花费大量的经历去阅读Documents才能得到相关的信息,而IE则直接帮你找到想要的信息和答案了。
    这我想也是SW的一个意义吧!


       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    那一段我们曾心贴着心,我想我更有权力关心你,可能你已走进别人风景,多希望也有星光的投影.努力为你改变,却变不了预留的伏笔.以为在你身边那也算永远
    仿佛还是昨天,可是昨天已非常遥远,但闭上双眼我还看得见.

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/26 13:43:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客2
    发贴心情 
    楼主读一下这个先。广义ai上,这两个是不怎么分的吧。
    http://www.aaai.org/AITopics/html/info.html
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/26 17:35:00
     
     MerryZhang 美女呀,离线,快来找我吧!
      
      
      威望:4
      头衔:CTO
      等级:计算机学士学位
      文章:442
      积分:2808
      门派:W3CHINA.ORG
      注册:2006/1/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给MerryZhang发送一个短消息 把MerryZhang加入好友 查看MerryZhang的个人资料 搜索MerryZhang在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看MerryZhang的博客3
    发贴心情 
    以下是引用iamwym在2006-5-26 17:35:00的发言:
    楼主读一下这个先。广义ai上,这两个是不怎么分的吧。
    http://www.aaai.org/AITopics/html/info.html


    打不开阿!还有,这并不是广义AI的定义阿。

    ----------------------------------------------
    那一段我们曾心贴着心,我想我更有权力关心你,可能你已走进别人风景,多希望也有星光的投影.努力为你改变,却变不了预留的伏笔.以为在你身边那也算永远
    仿佛还是昨天,可是昨天已非常遥远,但闭上双眼我还看得见.

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/26 23:15:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客4
    发贴心情 
    不是吧,aaai的官方网站你打不开,汗,那还搞啥AI啊……升级连接先吧
    内容太多了,贴不上来。恕我直言啊,楼主你的理解有很大问题呢,关键字提取就是IR,楼主有没有读过IR的教材啊……现在都是auto ir好不好,谁还用人工啊?
    关于information retrieval,这个能访问么?http://www.dcs.gla.ac.uk/Keith/Preface.html
    要说不同,我贴一段来自GATE的吧:
    Information Extraction is not Information Retrieval: Information Extraction differs from traditional techniques in that it does not recover from a collection a subset of documents which are hopefully relevant to a query, based on key-word searching (perhaps augmented by a thesaurus). Instead, the goal is to extract from the documents (which may be in a variety of languages) salient facts about prespecified types of events, entities or relationships. These facts are then usually entered automatically into a database, which may then be used to analyse the data for trends, to give a natural language summary, or simply to serve for on-line access.

    楼主有可能是读了这个以后的感触吧,他们说的keyword search,可不是“人们还需要花费大量的经历去阅读Documents才能得到相关的信息”。

    IE对于SW更有用,显然这点在text2onto的成功上已经被证明了,但这不是sw的意义所在。IE给sw提供了解析非结构化数据的技术,而不是sw反过来支持IE。

    说个题外话,sheffield的人,基本上是用锤子把这个IE概念强行建立起来的,呵呵,他们无论什么项目都要把GATE敲进去,还说是自然语言工程中的eclipse。有些英国人仗着英语是母语,确实有点皮厚。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/27 0:53:00
     
     MerryZhang 美女呀,离线,快来找我吧!
      
      
      威望:4
      头衔:CTO
      等级:计算机学士学位
      文章:442
      积分:2808
      门派:W3CHINA.ORG
      注册:2006/1/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给MerryZhang发送一个短消息 把MerryZhang加入好友 查看MerryZhang的个人资料 搜索MerryZhang在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看MerryZhang的博客5
    发贴心情 
    多谢斑竹,也许我的理解的确有偏差。

    ----------------------------------------------
    那一段我们曾心贴着心,我想我更有权力关心你,可能你已走进别人风景,多希望也有星光的投影.努力为你改变,却变不了预留的伏笔.以为在你身边那也算永远
    仿佛还是昨天,可是昨天已非常遥远,但闭上双眼我还看得见.

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/27 21:07:00
     
     MerryZhang 美女呀,离线,快来找我吧!
      
      
      威望:4
      头衔:CTO
      等级:计算机学士学位
      文章:442
      积分:2808
      门派:W3CHINA.ORG
      注册:2006/1/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给MerryZhang发送一个短消息 把MerryZhang加入好友 查看MerryZhang的个人资料 搜索MerryZhang在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看MerryZhang的博客6
    发贴心情 
    以下是引用iamwym在2006-5-27 0:53:00的发言:
    不是吧,aaai的官方网站你打不开,汗,那还搞啥AI啊……升级连接先吧
    内容太多了,贴不上来。恕我直言啊,楼主你的理解有很大问题呢,关键字提取就是IR,楼主有没有读过IR的教材啊……现在都是auto ir好不好,谁还用人工啊?
    关于information retrieval,这个能访问么?http://www.dcs.gla.ac.uk/Keith/Preface.html
    要说不同,我贴一段来自GATE的吧:
    Information Extraction is not Information Retrieval: Information Extraction differs from traditional techniques in that it does not recover from a collection a subset of documents which are hopefully relevant to a query, based on key-word searching (perhaps augmented by a thesaurus). Instead, the goal is to extract from the documents (which may be in a variety of languages) salient facts about prespecified types of events, entities or relationships. These facts are then usually entered automatically into a database, which may then be used to analyse the data for trends, to give a natural language summary, or simply to serve for on-line access.

    楼主有可能是读了这个以后的感触吧,他们说的keyword search,可不是“人们还需要花费大量的经历去阅读Documents才能得到相关的信息”。

    IE对于SW更有用,显然这点在text2onto的成功上已经被证明了,但这不是sw的意义所在。IE给sw提供了解析非结构化数据的技术,而不是sw反过来支持IE。

    说个题外话,sheffield的人,基本上是用锤子把这个IE概念强行建立起来的,呵呵,他们无论什么项目都要把GATE敲进去,还说是自然语言工程中的eclipse。有些英国人仗着英语是母语,确实有点皮厚。



    哇,版主说话好损阿。只是网络链接上不去,却这样损人。
    如果没有IE,那么SW的优越性如何体现出来呢?如何觉得SW与传统的技术有优越性呢?感觉现在好多都是在空谈。
    也许版主对sheffield的人有偏见,毕竟人家还是做了很多工作的。

    ----------------------------------------------
    那一段我们曾心贴着心,我想我更有权力关心你,可能你已走进别人风景,多希望也有星光的投影.努力为你改变,却变不了预留的伏笔.以为在你身边那也算永远
    仿佛还是昨天,可是昨天已非常遥远,但闭上双眼我还看得见.

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/27 21:12:00
     
     Ambrosia 美女呀,离线,快来找我吧!
      
      
      威望:1
      头衔:天使
      等级:计算机学士学位
      文章:377
      积分:2304
      门派:XHTML.ORG.CN
      注册:2006/2/23

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Ambrosia发送一个短消息 把Ambrosia加入好友 查看Ambrosia的个人资料 搜索Ambrosia在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Ambrosia的博客7
    发贴心情 
    优越只是说说而已。如何体现出来要看你做的实验是什么,结果如何,楼主老问这个问题,我也是sw搞ir的,体现了优越性就可以让google靠边站马?你想别人的优越性都出来了,我们还有什么好研究的呢,呵呵。觉得国外的人口气都这样,不需很在意,呵呵
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/29 12:05:00
     
     MerryZhang 美女呀,离线,快来找我吧!
      
      
      威望:4
      头衔:CTO
      等级:计算机学士学位
      文章:442
      积分:2808
      门派:W3CHINA.ORG
      注册:2006/1/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给MerryZhang发送一个短消息 把MerryZhang加入好友 查看MerryZhang的个人资料 搜索MerryZhang在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看MerryZhang的博客8
    发贴心情 
    没有办法啊,如果没有实用性并解决现有的问题,以及相对于老的技术具有优越性,就不会往上面投精力进行研究和开发了。

    ----------------------------------------------
    那一段我们曾心贴着心,我想我更有权力关心你,可能你已走进别人风景,多希望也有星光的投影.努力为你改变,却变不了预留的伏笔.以为在你身边那也算永远
    仿佛还是昨天,可是昨天已非常遥远,但闭上双眼我还看得见.

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/29 14:42:00
     
     Ambrosia 美女呀,离线,快来找我吧!
      
      
      威望:1
      头衔:天使
      等级:计算机学士学位
      文章:377
      积分:2304
      门派:XHTML.ORG.CN
      注册:2006/2/23

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Ambrosia发送一个短消息 把Ambrosia加入好友 查看Ambrosia的个人资料 搜索Ambrosia在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Ambrosia的博客9
    发贴心情 
    o, 你是不是在写相关项目的proposal阿?如果是纵向的,就照着bl那篇文章把sw狂吹一番,不信要不到钱。有几个人有lee牛的?如果是横向的,那还真不好说阿,我总觉得sw不是这两年的事,呵呵
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/30 13:15:00
     
     iamwym 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      等级:计算机硕士学位(版主)
      文章:2454
      积分:17456
      门派:XML.ORG.CN
      注册:2004/11/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给iamwym发送一个短消息 把iamwym加入好友 查看iamwym的个人资料 搜索iamwym在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问iamwym的主页 引用回复这个贴子 回复这个贴子 查看iamwym的博客10
    发贴心情 
    我只是觉得aaai等于对于ai的意义,就如google对于现在的web。。。
    sw的优越性可以肯定不是通过IE来体现的吧,非结构化数据的处理是非常有限的,text2onto的evaluation充分说明了这个问题
    另外,gate是sheffield以前有的一个phd牛人做的,后来整个东西的开发都是不断在往核心上面贴膏药。不过他们对于多国语言的支持,确实还是做了很多工作,特地找中国人和阿拉伯人参与开发。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/6/2 4:07:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 20:07:16

    本主题贴数14,分页: [1] [2]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    109.375ms