新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     >>W3CHINA.ORG讨论区<<     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> Cloud Computing(云计算), SaaS(软件即服务), Grid Computing(网格计算), OGSA, OGSI, WSRF, Globus Toolkit, Semantic P2P(语义P2P), Semantic Grid(语义网格), P2P Computing(对等计算),
    [返回] W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWLW3CHINA.ORG讨论区 - Web新技术讨论『 云计算,网格,SaaS,P2P 』 → 我打算做一个基于语义搜索的数据网格 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 34065 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 我打算做一个基于语义搜索的数据网格 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     davylakerxml 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:124
      门派:XML.ORG.CN
      注册:2005/3/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给davylakerxml发送一个短消息 把davylakerxml加入好友 查看davylakerxml的个人资料 搜索davylakerxml在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看davylakerxml的博客楼主
    发贴心情 我打算做一个基于语义搜索的数据网格

    目前感觉sementtic web,grid等离一般的技术人员还是很远的,它们似乎只存在于象牙塔之中。其实我觉得利用现有的技术完全可以实现一个sementic grid。他不可能很完美,也不可能投入商业运营,可是他可以给个人用户使用。
    http://01235.net/default.asp?cateID=2
    希望有人能和我一起学习实施这个项目。

       收藏   分享  
    顶(0)
      




    ----------------------------------------------
    论文要开题了

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/20 20:11:00
     
     yanxq 帅哥哟,离线,有人找我吗?
      
      
      威望:4
      等级:大四(GRE考了1400分!)(版主)
      文章:183
      积分:1309
      门派:XML.ORG.CN
      注册:2004/9/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yanxq发送一个短消息 把yanxq加入好友 查看yanxq的个人资料 搜索yanxq在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看yanxq的博客2
    发贴心情 
    关注并支持,好主意,希望能做下去
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/20 21:30:00
     
     davylakerxml 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:124
      门派:XML.ORG.CN
      注册:2005/3/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给davylakerxml发送一个短消息 把davylakerxml加入好友 查看davylakerxml的个人资料 搜索davylakerxml在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看davylakerxml的博客3
    发贴心情 数据流转
    我的想法类似于一个分布式的blog框架。采用集中式拓扑结构。但是不同于传统的集中式,中心服务器不负责传输和维护具体的内容信息,而只是传输和维护具体数据的索引信息。各个网格站点基本上为个人站点,相互之间也不交换数据。

    浏览器请求网格系统中的资源时,首先到某个网格站点要求取得索引信息,网格站点到中心服务器取得更新的索引后,返回给浏览器。

    浏览器根据索引文件到各个网格站点取得分布式数据,显示。
    当浏览器提交数据时,提交到网格站点,然后网格站点向中心服务器通告数据更新索引信息,以使得中心服务器的索引更新。

    系统的特点在于:中心存储维护的数据简单;网格站点轻便,可移植性强;浏览器为RIA。
    请关注:http://01235.net/default.asp?cateID=2

    ----------------------------------------------
    论文要开题了

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/21 12:17:00
     
     whale 帅哥哟,离线,有人找我吗?水瓶座1980-1-25
      
      
      威望:7
      等级:大四(GRE考了1600分!)(版主)
      文章:131
      积分:1300
      门派:XML.ORG.CN
      注册:2004/7/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给whale发送一个短消息 把whale加入好友 查看whale的个人资料 搜索whale在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看whale的博客4
    发贴心情 
    支持!我们多交流一下!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/21 17:34:00
     
     davylakerxml 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:124
      门派:XML.ORG.CN
      注册:2005/3/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给davylakerxml发送一个短消息 把davylakerxml加入好友 查看davylakerxml的个人资料 搜索davylakerxml在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看davylakerxml的博客5
    发贴心情 数据存储与交换
    数据存储与交换 ,着重考虑三点:分布式数据,语义搜索,面向用户。
    (这里有必要描述一下“用户”,我所要提供和描述的是一个框架,使用这个框架来发布自己的blog等应用的个人,就是用户,他们本身会编程,会做网页或者已经有了网页,但是不期望他们的水平很高或愿意在建立网站应用上花很多时间。我暂且称他们为gridder。)

    分布式和语义,答案似乎已经有了rdf/xml。但是并不能面向用户。rdf/xml很难啃,如何指定将rdf/xml中的数据显示出来,也是难题。对于框架开发本身也有难度,站点上不同平台对rdf/xml的操作有不同的方式,要想统一的话如使用dom、sax,就很底层了。或许可以将xml的解析放到browser上,在javascript中使用dom,这还是底层的操作,而且可能提供的js lib文件比较大,带来传输速度问题。mozilla中正开发E4X,提供xml的javascript bingding,未来可能会在各种浏览器中集成,这是一个值得期待的好消息,但是利用binding 操作xml时,js lib可能也不会很小。总之在通用性,开发难度以及灵活性之间难以兼顾。

    另一中选择是rdf/n3,其不是w3c的推荐标准,但是比rdf/xml更受欢迎。进一步抽去n3中的rule,formulate等与数据存贮关系不大的部分,我们可以关注它的子集turtle :http://www.ilrt.bris.ac.uk/discovery/2004/01/turtle/,turtle是对n3的另一个子集n-triple 的扩展。使用turtle会有两个问题:不像xml那样有节点的概念,因此无法取得文档的某个片断;工具太少。

    前一个问题可以通过使用Turtle的一个超集Trig:http://www.wiwiss.fu-berlin.de/suhl/bizer/TriG/#turtle 来解决。它用来表示具名图(named graph)。 和quad(四元组)比较相似,增加的元为graphname,以表示一个表述片断(具名图)。具名图是可以嵌套的,他的每一个资源也是图。graphname和Id间可以建立对应关系,从而实现idrdf。

    后一个问题可以通过将Trig转化为json来解决 ,实际上Trig和json的结构很像。转化起来比较简单,除了作为subject 的空节点难以用json表示,但相信也可以解决。而json是很适合于交换数据和处理数据的,这方面几乎超过了xml。对于grider而言他们只需要学习json就够了,这非常简单。

    能否直接用json存贮文件?方便,不需要转化了,但是目前还没有看到这方面的例子,而且rdf工具也不能处理json文件。但是不管用json还是Trig存贮数据,只要能提供json<-->Trig转化api,就不是问题,而这很简单。
    目前可以考虑提供这样的api,暂命名为json3G
    请关注:http://01235.net/default.asp?cateID=2

    ----------------------------------------------
    论文要开题了

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/22 12:49:00
     
     yanxq 帅哥哟,离线,有人找我吗?
      
      
      威望:4
      等级:大四(GRE考了1400分!)(版主)
      文章:183
      积分:1309
      门派:XML.ORG.CN
      注册:2004/9/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yanxq发送一个短消息 把yanxq加入好友 查看yanxq的个人资料 搜索yanxq在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看yanxq的博客6
    发贴心情 
    很好,可以多交流
    其实,xml/rdf在浏览器重的数据显示,可以使用xslt来解决
    及哪一不要使用json进行文件存储

    其实我觉得这些都是小的问题,还有不叫关键的是系统的体系结构等等的设计工作吧

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/22 22:50:00
     
     davylakerxml 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:124
      门派:XML.ORG.CN
      注册:2005/3/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给davylakerxml发送一个短消息 把davylakerxml加入好友 查看davylakerxml的个人资料 搜索davylakerxml在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看davylakerxml的博客7
    发贴心情 
    谢谢yanxq的回复。

    前面我说考虑到rdf/xml比较难啃和比较难以显示,是针对多数一般用户而言,因为框架是给用户使用的。用rdf/xml表示语义方面本身有缺陷,用其书写的文档可读性很差,对用户来讲这是最要命的。至于显示,xsl的确是显示xml一个好方法,也符合系统中显示模板重用的需要。但是xsl显示rdf/xml可能会不适合,而且显得有点多余。因为rdf不像xml,他已经很淡化了节点的概念,而对节点的处理是xsl的长处,其次rdf中是三元组,xpath等工具可能都用不上了。已经有人实现了用xsl显示rdf的工具包,但是我个人觉得对rdf/xml的显示最直接的方法是提取三元组并显示出来。另外一个我重点考虑的还是xsl可读性-比xml数据文件的可读性更差。其实我更倾向与如php中的html模板的方法,所见及所得。当然php中模板是在server端实现的。至于客户端的实现可以参考trimpathwww.trimpath.com
    当然xml+xsl是一个可以称为标准的实现方法,我也不能只把我自己认为好的方法强加给用户而舍弃xml+xsl,只是目前我认为使用它可能带来很多麻烦而逐渐使我失去耐心。
    目前我可能太专注于一些技术实现,而没有将系统架构讲清楚,希望以后能有互动的沟通,讲得清楚一点。
    至于说尽量不用json存贮,请你给我一些理由,它可能对我很有帮助。谢谢

    ----------------------------------------------
    论文要开题了

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/23 22:36:00
     
     yanxq 帅哥哟,离线,有人找我吗?
      
      
      威望:4
      等级:大四(GRE考了1400分!)(版主)
      文章:183
      积分:1309
      门派:XML.ORG.CN
      注册:2004/9/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yanxq发送一个短消息 把yanxq加入好友 查看yanxq的个人资料 搜索yanxq在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看yanxq的博客8
    发贴心情 
    我想的是,要较大范围应用,还是应该用关系数据库,虽然可能麻烦些,但是毕竟比较成熟
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/23 23:50:00
     
     davylakerxml 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:124
      门派:XML.ORG.CN
      注册:2005/3/4

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给davylakerxml发送一个短消息 把davylakerxml加入好友 查看davylakerxml的个人资料 搜索davylakerxml在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看davylakerxml的博客9
    发贴心情 

    谢谢yanxq的回复

    我考虑过使用acess数据库。目前使用一些新的技术,毫无疑问都会碰到很多问题,没有办法边干边学了,谁叫我们对它感兴趣呢。不想使用传统数据库主要从三个方面考虑:1 用户为个人,数据结构比较简单,安全、事务等要求比较低。数据分布式存贮,即每个用户的站点上基本上只存贮本人发布的信息,因此数据量不会很大。所以我觉得数据文件基本上够用了。2 用户所能申请并使用的数据库和网站的语言可能是多种多样的如sqlserver,mysql,php,asp,jsp等,如果使用传统数据库的话,我要都实现,工作量大了。3。传统数据库几乎不适合实现语义,xml数据库可能是一种选择,目前我还没有接触过它。
    因为我没有把系统需求、系统架构说清楚,如何实现语义也没有提及,因此可能我和yanqx的理解有较大的分歧,但这不是问题,我们可以共同学习,越辩越明。

    ----------------------------------------------
    论文要开题了

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/24 20:19:00
     
     yanxq 帅哥哟,离线,有人找我吗?
      
      
      威望:4
      等级:大四(GRE考了1400分!)(版主)
      文章:183
      积分:1309
      门派:XML.ORG.CN
      注册:2004/9/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给yanxq发送一个短消息 把yanxq加入好友 查看yanxq的个人资料 搜索yanxq在『 云计算,网格,SaaS,P2P 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看yanxq的博客10
    发贴心情 
    知道你的意思了。
    你的想法是使用json存储各个网格节点上的共享数据
    我的想法是在中心服务器上使用数据库,并不矛盾吧。
    其实,我最近在想,能不能把这些东西和bt结合,这样可能形成比较好的数据共享网格。
    我个人觉得这比较有意思
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/4/24 22:38:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 云计算,网格,SaaS,P2P 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/12/18 16:51:23

    本主题贴数20,分页: [1] [2]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    125.000ms