新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
随时掌握技术动态,请订阅:
《Web技术日报》
《机器学习日报》
   中国XML论坛     >>W3CHINA.ORG讨论区<<     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 在这里讨论其他W3C规范
    [返回] W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWLW3CHINA.ORG讨论区 - Web新技术讨论『 其他W3C规范 』 → saxon6.5.3 对中文的排序问题(xsl:sort, saxon6.5.3, chinese character) 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 19263 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: saxon6.5.3 对中文的排序问题(xsl:sort, saxon6.5.3, chinese character) 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     lizlex 帅哥哟,离线,有人找我吗?
      
      
      等级:大一(高数修炼中)
      文章:24
      积分:189
      门派:XML.ORG.CN
      注册:2005-10-13

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给lizlex发送一个短消息 把lizlex加入好友 查看lizlex的个人资料 搜索lizlex在『 其他W3C规范 』的所有贴子 引用回复这个贴子 回复这个贴子 查看lizlex的博客楼主
    发贴心情 saxon6.5.3 对中文的排序问题(xsl:sort, saxon6.5.3, chinese character)

    使用saxon6.5.3,用<xsl:sort>对中文进行排序时,出现混乱,得不到想要的结果,大家是如何解决的?
    源代码如下:
    <-- country.xml -->
    <?xml version="1.0" encoding="gb2312"?>
    <root>
     <book>
      <title>中国(Zhong guo)(4)</title>
     </book>
     <book>
      <title>美国(Mei guo)(2)</title>
     </book>
     <book>
      <title>日本(Ri ben)(3)</title>
     </book>
     <book>
      <title>俄罗斯(e luo si)(1)</title>
     </book>
    </root>

    <--sort.xsl-->
    <?xml version="1.0" encoding="GB2312"?>
    <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:fo="http://www.w3.org/1999/XSL/Format">
     <xsl:template match="/">
      <root>
       <xsl:for-each select="root/book">
        <xsl:sort select="title"/>
        <p>
         <xsl:value-of select="title"/>
        </p>
       </xsl:for-each>
      </root>
     </xsl:template>
    </xsl:stylesheet>
    使用saxon6.5.3得到的错误结果如下:
    <?xml version="1.0" encoding="utf-8"?>
    <root xmlns:fo="http://www.w3.org/1999/XSL/Format">
     <p>中国(Zhong guo)(4)</p>
     <p>俄罗斯(e luo si)(1)</p>
     <p>日本(Ri ben)(3)</p>
     <p>美国(Mei guo)(2)</p>
    </root>

    应该怎么办呢?


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2008-3-17 15:41:00
     
     jj_long 帅哥哟,离线,有人找我吗?
      
      
      威望:1
      等级:大三(面向对象是个好东东!)
      文章:42
      积分:574
      门派:XML.ORG.CN
      注册:2008-7-29

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jj_long发送一个短消息 把jj_long加入好友 查看jj_long的个人资料 搜索jj_long在『 其他W3C规范 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jj_long的博客2
    发贴心情 
    默认情况下,XSLT引擎设置的sort的数据类型是text,语言为英语。

    这里的问题是需要按中文排序。

    请参考:
    1. http://saxon.sourceforge.net/saxon6.5/xsl-elements.html#xsl:sort
    2. http://saxon.sourceforge.net/saxon6.5/extensibility.html#Implementing-a-collating-sequence

    即:你需要在你的XSLT代码里指定语言,并且提供相应的Java扩展库:
    1. XSLT
    ====================================
    <?xml version='1.0'?>

    <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" indent="yes"/>


    <xsl:template match="/">
     <root>
      <xsl:for-each select="root/book">
       <xsl:sort select="title" lang="cn"/>
       <p>
       <xsl:value-of select="title"/>
       </p>
      </xsl:for-each>
     </root>
    </xsl:template>
    </xsl:stylesheet>

    ====================================

    2. 扩展的Java代码:
    ====================================
    package com.icl.saxon.sort;

    import java.text.Collator;
    import java.util.Comparator;

    public class Compare_cn extends com.icl.saxon.sort.TextComparer {
     
     Comparator cmp = Collator.getInstance(java.util.Locale.CHINA);

     @Override
     public int compare(Object arg0, Object arg1) {
      // TODO Auto-generated method stub
      
      return cmp.compare(arg0,arg1);
      
     }
     
     
    }
    ====================================

    3.输出结果:
    ====================================
    <?xml version="1.0" encoding="utf-8"?>
    <root>
       <p>俄罗斯(e luo si)(1)</p>
       <p>美国(Mei guo)(2)</p>
       <p>日本(Ri ben)(3)</p>
       <p>中国(Zhong guo)(4)</p>
    </root>
    ====================================


    把Java代码编译然后打包成jar文件,配置到你的classpath里边。

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2010-5-17 14:21:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 其他W3C规范 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2019-3-25 22:28:02

    本主题贴数2,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( 2 0 0 3 - 2 0 1 0 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    31.250ms