新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     >>W3CHINA.ORG讨论区<<     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML网站展示,XML源代码,XML编程示例。 本版仅接受原创、转贴、网站展示,具体的技术交流请前往各相关版块。
    [返回] W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWLXML.ORG.CN讨论区 - XML技术『 XML源码及示例(仅原创和转载) 』 → [转载]献给学习XMLHTTP的朋友 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 6386 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [转载]献给学习XMLHTTP的朋友 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 XML源码及示例(仅原创和转载) 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 [转载]献给学习XMLHTTP的朋友

    转自: 联讯浩天-技术站 http://www.lssky.net/Article_Show.asp?ArticleID=93

    献给学习XMLHTTP的朋友  

    [ 作者:佚名    转贴自:本站原创    点击数:1    更新时间:2004-1-14    文章录入:☆浪子★ ] 
    很久没写过东西了,今天看了chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》,于是优化了这个程序,并且将所有的功能都函数化了,希望对学习 XMLHTTP 的朋友有所帮助。
    程序实现功能:自动将远程页面的文件中的图片下载到本地。

    <%
    '将本文保存为 save2local.asp
    '测试:save2local.asp?url=http://ent.sina.com.cn/s/m/2003-11-11/1411231388.html
    '本文根据 chinahuman 的《用asp自动解析网页中的图片地址,并将其保存到本地服务器》改编和优化
    '自动创建目录,自动将原文件名更名,文件格式的限制以及其他功能的一些优化
    '自动保存网页文件中 http://.... 格式的图片到本地
    '转载请注明出处:http://www.jaron.cn http://www.csdn.net/develop
    '参数设置开始
    url = request("url")
    localaddr = server.MapPath("images_remote/") '保存到本地的目录
    localdir = "images_remote/" 'http 访问的相对路径
    AllowFileExt = "jpg|bmp|png|gif" '支持的文件名格式
    '参数设置完毕

    if createdir(localaddr) = false then
    response.Write "创建目录失败,请检查目录权限"
    response.End
    end if
    response.Write Convert2LocalAddr(url,localaddr,localdir)

    function Convert2LocalAddr(url,localaddr,localdir)
    '参数说明
    'url 页面地址
    'localaddr 保存本地的物理地址
    'localdir 相对路径
    strContent = getHTTPPage(url)
    Set objRegExp = New Regexp
    objRegExp.IgnoreCase = True
    objRegExp.Global = True
    objRegExp.Pattern = "<img.+?>"
    Set Matches =objRegExp.Execute(strContent)
    For Each Match in Matches
    RetStr = RetStr & GetRemoteImages(Match.Value)
    Next
    ImagesArray=split(RetStr,"||")
    RemoteImage=""
    LocalImage=""
    for i=1 to ubound(ImagesArray)
    if ImagesArray(i)<>"" and instr(RemoteImage,ImagesArray(i))<1 then
    fname=baseurl&cstr(i&mid(ImagesArray(i),instrrev(ImagesArray(i),".")))
    ImagesFileName = ImagesArray(i)
    AllowFileExtArray = split(AllowFileExt,"|")
    isGetFile = false
    for tmp = 0 to ubound(AllowFileExtArray)
    if lcase(GetFileExt(ImagesFileName)) = ALlowFileExtArray(tmp) then
    isGetFile=True
    end if
    next
    if isGetFile = true then
    newfilename = GenerateRandomFileName(fname)
    call Save2Local(ImagesFileName,localaddr & "/" & newfilename)
    RemoteImage=RemoteImage&"||"& ImagesFileName
    LocalImage=LocalImage&"||" & localdir & newfilename
    end if
    end if
    next
    arrnew=split(LocalImage,"||")
    arrall=split(RemoteImage,"||")
    for i=1 to ubound(arrnew)
    strContent=replace(strContent,arrall(i),arrnew(i))
    next
    Convert2LocalAddr = strContent
    end function

    function GetRemoteImages(str)
    Set objRegExp1 = New Regexp
    objRegExp1.IgnoreCase = True
    objRegExp1.Global = True
    objRegExp1.Pattern = "http://.+? "
    set mm=objRegExp1.Execute(str)
    For Each Match1 in mm
    tmpaddr = left(Match1.Value,len(Match1.Value)-1)
    GetRemoteImages=GetRemoteImages&"||" & replace(replace(tmpaddr,"""",""),"'","")
    next
    end function

    function getHTTPPage(url)
    on error resume next
    dim http
    set http=Server.createobject("Msxml2.XMLHTTP")
    Http.open "GET",url,false
    Http.send()
    if Http.readystate<>4 then exit function
    getHTTPPage=bytes2BSTR(Http.responseBody)
    set http=nothing
    if err.number<>0 then err.Clear
    end function

    Function bytes2BSTR(vIn)
    dim strReturn
    dim i,ThisCharCode,NextCharCode
    strReturn = ""
    For i = 1 To LenB(vIn)
    ThisCharCode = AscB(MidB(vIn,i,1))
    If ThisCharCode < &H80 Then
    strReturn = strReturn & Chr(ThisCharCode)
    Else
    NextCharCode = AscB(MidB(vIn,i+1,1))
    strReturn = strReturn & Chr(CLng(ThisCharCode) * &H100 + CInt(NextCharCode))
    i = i + 1
    End If
    Next
    bytes2BSTR = strReturn
    End Function

    function getHTTPimg(url)
    on error resume next
    dim http
    set http=server.createobject("MSXML2.XMLHTTP")
    Http.open "GET",url,false
    Http.send()
    if Http.readystate<>4 then exit function
    getHTTPimg=Http.responseBody
    set http=nothing
    if err.number<>0 then err.Clear
    end function

    function Save2Local(from,tofile)
    dim geturl,objStream,imgs
    geturl=trim(from)
    imgs=gethttpimg(geturl)
    Set objStream = Server.CreateObject("ADODB.Stream")
    objStream.Type =1
    objStream.Open
    objstream.write imgs
    objstream.SaveToFile tofile,2
    objstream.Close()
    set objstream=nothing
    end function

    function geturlencodel(byval url)'中文文件名转换
    Dim i,code
    geturlencodel=""
    if trim(Url)="" then exit function
    for i=1 to len(Url)
    code=Asc(mid(Url,i,1))
    if code<0 Then code = code + 65536
    If code>255 Then
    geturlencodel=geturlencodel&"%"&Left(Hex(Code),2)&"%"&Right(Hex(Code),2)
    else
    geturlencodel=geturlencodel&mid(Url,i,1)
    end if
    next
    end function

    Function GenerateRandomFileName(ByVal szFilename) '根据原文件名,自动以日期YYYY-MM-DD-RANDOM格式生成新文件名
    Randomize
    ranNum = Int(90000 * Rnd) + 10000
    If Month(Now) < 10 Then c_month = "0" & Month(Now) Else c_month = Month(Now)
    If Day(Now) < 10 Then c_day = "0" & Day(Now) Else c_day = Day(Now)
    If Hour(Now) < 10 Then c_hour = "0" & Hour(Now) Else c_hour = Hour(Now)
    If Minute(Now) < 10 Then c_minute = "0" & Minute(Now) Else c_minute = Minute(Now)
    If Second(Now) < 10 Then c_second = "0" & Second(Now) Else c_second = Minute(Now)
    fileExt_a = Split(szFilename, ".")
    FileExt = LCase(fileExt_a(UBound(fileExt_a)))
    GenerateRandomFileName = Year(Now) & c_month & c_day & c_hour & c_minute & c_second & "_" & ranNum & "." & FileExt
    End Function

    Function CreateDIR(ByVal LocalPath) '建立目录的程序,如果有多级目录,则一级一级的创建
    On Error Resume Next
    LocalPath = Replace(LocalPath, "\", "/")
    Set FileObject = server.CreateObject("Scripting.FileSystemObject")
    patharr = Split(LocalPath, "/")
    path_level = UBound(patharr)
    For I = 0 To path_level
    If I = 0 Then pathtmp = patharr(0) & "/" Else pathtmp = pathtmp & patharr(I) & "/"
    cpath = Left(pathtmp, Len(pathtmp) - 1)
    If Not FileObject.FolderExists(cpath) Then FileObject.CreateFolder cpath
    Next
    Set FileObject = Nothing
    If Err.Number <> 0 Then
    CreateDIR = False
    Err.Clear
    Else
    CreateDIR = True
    End If
    End Function

    function GetfileExt(byval filename)
    fileExt_a=split(filename,".")
    GetfileExt=lcase(fileExt_a(ubound(fileExt_a)))
    end function
    %>


    有一点要注意的是,这里只是分析了以 http开头的图片的地址。否则不下载图片,可以转换一下地址就行了,再提供几个小函数,分析地址用的:

    Function findurl(thisurl)
    if thisurl <> "" Then
    findurl=""
    strlen=InStr(8,thisurl,"/")
    If strlen=0 Then strlen =1
    findurl=Mid(thisurl,strlen,28)
    end if
    end Function

    function findurlpath(thisurl)
    thisurl = replace(thisurl,"//","@@")
    ary_tmp = split(thisurl,"/")
    for tmp = 0 to ubound(ary_tmp)
    if tmp < ubound(ary_tmp) then
    urltmp = urltmp & "/" & ary_tmp(tmp)
    end if
    next
    urltmp = right(urltmp,len(urltmp)-1)
    findurlpath = replace(urltmp,"@@","//") & "/"
    end function

    function findurlhost(thisurl)
    thisurl = replace(thisurl,"//","@@")
    ary_tmp = split(thisurl,"/")
    urltmp = ary_tmp(0)
    findurlhost = replace(urltmp,"@@","//") & "/"
    findurlhost = left(findurlhost,len(findurlhost)-1)
    end function


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/1/29 20:18:00
     
     阳光小虾 帅哥哟,离线,有人找我吗?处女座1981-8-24
      
      
      头衔:CHO
      等级:大二(研究C++)
      文章:93
      积分:293
      门派:XML.ORG.CN
      注册:2003/11/25

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给阳光小虾发送一个短消息 把阳光小虾加入好友 查看阳光小虾的个人资料 搜索阳光小虾在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看阳光小虾的博客2
    发贴心情 
    好东西,顶!找时间练习一下看看。

    ----------------------------------------------
    < 梦想·天空 >

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/2/15 0:45:00
     
     Betteronly 帅哥哟,离线,有人找我吗?处女座1981-9-2
      
      
      头衔:小鸟试飞
      等级:大一新生
      文章:64
      积分:339
      门派:W3CHINA.ORG
      注册:2004/3/31

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给Betteronly发送一个短消息 把Betteronly加入好友 查看Betteronly的个人资料 搜索Betteronly在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看Betteronly的博客3
    发贴心情 
    好东东,先下
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/4/5 9:19:00
     
     robert 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(汇编考了97分!)
      文章:77
      积分:304
      门派:XML.ORG.CN
      注册:2004/4/7

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给robert发送一个短消息 把robert加入好友 查看robert的个人资料 搜索robert在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看robert的博客4
    发贴心情 
    看不懂,我是学C#和Java的,能够给点Asp.net或jsp代码行吗?

    ----------------------------------------------
    [img]http://www.kcgx.com/images/rOBERT.gif[/img]

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/4/8 17:00:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML源码及示例(仅原创和转载) 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/11/26 15:01:22

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    2,730.469ms