新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     >>W3CHINA.ORG讨论区<<     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> The future of AI, is the future of computer
    [返回] W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL计算机理论与工程『 人工智能 :: 机器学习|数据挖掘|进化计算 』 → 有没有研究web表格信息抽取(information extraction)的同盟阿? 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 34467 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 有没有研究web表格信息抽取(information extraction)的同盟阿? 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     dawnice 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:3
      积分:68
      门派:XML.ORG.CN
      注册:2005/3/22

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给dawnice发送一个短消息 把dawnice加入好友 查看dawnice的个人资料 搜索dawnice在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看dawnice的博客11
    发贴心情 

    你说的是不是wrapping啊?
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/3 0:27:00
     
     泡泡天上飘 美女呀,离线,快来找我吧!
      
      
      等级:大一(高数修炼中)
      文章:17
      积分:117
      门派:XML.ORG.CN
      注册:2005/4/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给泡泡天上飘发送一个短消息 把泡泡天上飘加入好友 查看泡泡天上飘的个人资料 搜索泡泡天上飘在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看泡泡天上飘的博客12
    发贴心情 
    wrapping是一个方面,我的两个同门师兄在做,我和另外一个同门在做通用表格提取。
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/3 14:40:00
     
     kingbull 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:58
      门派:XML.ORG.CN
      注册:2005/7/13

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给kingbull发送一个短消息 把kingbull加入好友 查看kingbull的个人资料 搜索kingbull在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看kingbull的博客13
    发贴心情 
    由人愿意讨论一些包装器生成吗
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/13 12:15:00
     
     kingbull 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:58
      门派:XML.ORG.CN
      注册:2005/7/13

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给kingbull发送一个短消息 把kingbull加入好友 查看kingbull的个人资料 搜索kingbull在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看kingbull的博客14
    发贴心情 
    关于通用表格的信息抽取一般用正则表达来做。例如"<(?:TABLE|table)[^>]*><(?:TR|tr)[^>]*><(?:TD|td)[^>]*>公司名称:(.*?)</(?:TD|td)></(?:TR|tr)></(?:TABLE|table)>";这个规则可以抽取公司名称后面的公司名
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/7/13 12:26:00
     
     carrol 美女呀,离线,快来找我吧!
      
      
      等级:大一新生
      文章:0
      积分:55
      门派:XML.ORG.CN
      注册:2005/9/2

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给carrol发送一个短消息 把carrol加入好友 查看carrol的个人资料 搜索carrol在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看carrol的博客15
    发贴心情 
    我的方向就是Wrapper的生成,不过看了些论文,还是很迷茫。希望高手指点一下!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/9/2 20:12:00
     
     chenjianyyzz 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:11
      积分:114
      门派:XML.ORG.CN
      注册:2004/3/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给chenjianyyzz发送一个短消息 把chenjianyyzz加入好友 查看chenjianyyzz的个人资料 搜索chenjianyyzz在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看chenjianyyzz的博客16
    发贴心情 
    有谁在研究wrapper吗?咱们可以一起探讨一下啊?我的MSN:chenjianyyzz@hotmail.com
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/9/29 17:46:00
     
     rcc123 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:15
      积分:137
      门派:XML.ORG.CN
      注册:2005/10/23

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给rcc123发送一个短消息 把rcc123加入好友 查看rcc123的个人资料 搜索rcc123在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看rcc123的博客17
    发贴心情 
    多看一些外文资料
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/10/23 8:30:00
     
     dududjf 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(猛啃高等数学)
      文章:15
      积分:139
      门派:W3CHINA.ORG
      注册:2005/10/26

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给dududjf发送一个短消息 把dududjf加入好友 查看dududjf的个人资料 搜索dududjf在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看dududjf的博客18
    发贴心情 
    我也正在搞这一方面的研究,主要使用概率模型学习,如Conditional Random Fields(CRF)。多多交流。Email: dududjf@21cn.com
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/10/28 12:14:00
     
     surmount 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:4
      积分:70
      门派:XML.ORG.CN
      注册:2005/10/28

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给surmount发送一个短消息 把surmount加入好友 查看surmount的个人资料 搜索surmount在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看surmount的博客19
    发贴心情 
    是用算法从WEB的HTML或XML语法中取得数据不
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/10/28 18:32:00
     
     ljztyygx 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:63
      门派:XML.ORG.CN
      注册:2006/2/3

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给ljztyygx发送一个短消息 把ljztyygx加入好友 查看ljztyygx的个人资料 搜索ljztyygx在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 引用回复这个贴子 回复这个贴子 查看ljztyygx的博客20
    发贴心情 用XML
    先把HTML转换成XML,然后把XML集成到关系数据库,最后进行数据挖掘。ljztyygx@126.com
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/2/3 14:27:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 人工智能 :: 机器学习|数据挖掘|进化计算 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/1/15 19:56:52

    本主题贴数21,分页: [1] [2] [3]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    93.750ms