以文本方式查看主题

-  W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL  (http://bbs.xml.org.cn/index.asp)
--  『 XML源码及示例(仅原创和转载) 』  (http://bbs.xml.org.cn/list.asp?boardid=32)
----  这样的数据如何转换成xml格式的,请高手指点  (http://bbs.xml.org.cn/dispbbs.asp?boardid=32&rootid=&id=50756)


--  作者:shenvo
--  发布时间:7/31/2007 10:02:00 AM

--  这样的数据如何转换成xml格式的,请高手指点
M P P010001X1 368.14 0.00 P010001X4 O P010001X5$GB-Naphthylbismuth dioxide P P010001X6C10 H7 Bi O2 P010001X7C10 H7 Bi O2 P010001X8ANCHAM 10 457 1938 Hanawalt et al. P010001X9MoKa1 0.709 F DD P010001XF BB P010001XG20.0000100 9.90000 18 3.40000 5 1P010001XI3.22000 3 3.15000 3 2.98000 3 2P010001XI2.67000 10 2.06000 3 1.93000 5 3P010001XI1.88000 10 1.61000 5 1.57000 3 4P010001XI1.52000 3 1.33000 3 1.24000 3 5P010001XI1.19000 5 6P010001XIB 20.0/X 9.90/2 2.67/1 1.88/1 3.40/1 1.93/1 1.61/1 1.19/1 3.22/1 3.15/1P010001X+B 20.0/X 9.90/2 3.40/1 3.22/1 3.15/1 2.98/1 2.67/1 2.06/1 1.93/1 1.88/1P010001X* EGS 93/ 6/16 0 0 10 92/12/09 P010001XK

以上的数据是从数据文件中取出的样本,如何转换成通用数据库的格式,或着是转换成xml格式的数据,请高手指点

M P
P010001X1 368.14 0.00
P010001X4 O
P010001X5$GB-Naphthylbismuth dioxide P
P010001X6C10 H7 Bi O2
P010001X7C10 H7 Bi O2
P010001X8ANCHAM 10 457 1938 Hanawalt et al.
P010001X9MoKa1 0.709 F DD
P010001XF BB
P010001XG20.0000100 9.90000 18 3.40000 5
1P010001XI3.22000 3 3.15000 3 2.98000 3
2P010001XI2.67000 10 2.06000 3 1.93000 5
3P010001XI1.88000 10 1.61000 5 1.57000 3
4P010001XI1.52000 3 1.33000 3 1.24000 3
5P010001XI1.19000 5
6P010001XIB 20.0/X 9.90/2 2.67/1 1.88/1 3.40/1 1.93/1 1.61/1 1.19/1 3.22/1 3.15/1
P010001X+B 20.0/X 9.90/2 3.40/1 3.22/1 3.15/1 2.98/1 2.67/1 2.06/1 1.93/1 1.88/1
P010001X* EGS 93/ 6/16 0 0 10 92/12/09
P010001XK


转换后的格式如:
<rxd>
    <P010001X1>P010001</P010001X1>
    <P010001X5>$GB-Naphthylbismuth dioxide </P010001X5>
    <P010001X6>C10 H7 Bi O2</P010001X6>
    <P010001X7>C10 H7 Bi O2</P010001X7>
    <P010001X8>ANCHAM  10  457 1938 Hanawalt et al. </P010001X8>
    <P010001X9>MoKa1 0.709         F        DD</P010001X9>
    <P010001XG>
      <P010001XI1>
          <D> 20.0000</D>
          <2theta>4.41</2theta>
          <I-IO>100</I-IO>
          <H></H>
          <K></K>
          <L></L>
      </P010001XI1>
      <P010001XI2>
          <D> 9.90000</D>
          <2theta>8.92</2theta>
          <I-IO>100</I-IO>
          <H></H>
          <K></K>
          <L></L>
      </P010001XI2>
    </P010001XG>
</rxd>


--  作者:shenvo
--  发布时间:7/31/2007 10:04:00 AM

--  
广告,还是自动的
--  作者:hello_21
--  发布时间:8/3/2007 3:05:00 PM

--  
ni 是什么数据库阿 ~!!
--  作者:swiping
--  发布时间:9/29/2007 4:44:00 PM

--  
等待高手解答
--  作者:63henry.black
--  发布时间:10/5/2007 8:00:00 PM

--  
共同关注
--  作者:龙藤
--  发布时间:10/8/2007 4:11:00 PM

--  
用数据本身作为XML标签名是很不合适的,如<P010001X1>就不是很好.最好搞清楚数据的意义,然后根据意义再来定标记名称.
--  作者:godson_2003
--  发布时间:1/3/2008 5:00:00 PM

--  
关注 帮顶
--  作者:shenvo
--  发布时间:1/3/2008 6:47:00 PM

--  
P010001X1不是数据本身,也是数据标识,但我不知道怎么把他们分离开
--  作者:Qr
--  发布时间:1/5/2008 9:44:00 AM

--  
从你的数据样本中找不出与XML转换的规则或规律。根据你的xml来看,很多文本是数据样本中的一小节信息里的一小段,这样就不好截取数据了。如果纯粹是按空格、制表符等来截取数据就方便了。


--  作者:linguoheng1234
--  发布时间:1/22/2008 10:37:00 PM

--  
共同期待最好的解答,我是初学者

--  作者:shenvo
--  发布时间:1/23/2008 9:18:00 PM

--  
感谢版主也一直关注我的帖子,谢谢!

我把原始文件的1/1000发上来,以供参考,可以用记事本打开,这个数据库是光谱衍射的实验数据,以前是一个软件里带的,我想做成web查询型的,不知道以前那个软件是怎么读数据的,想改成通用数据库格式或者是XML格式


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
2,453.125ms