新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> XML网站展示,XML源代码,XML编程示例。 本版仅接受原创、转贴、网站展示,具体的技术交流请前往各相关版块。
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 XML源码及示例(仅原创和转载) 』 → 有没有方法可以提取html文件中感兴趣的部分为xml文件? 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 3240 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 有没有方法可以提取html文件中感兴趣的部分为xml文件? 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     zhangsf 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:53
      积分:417
      门派:XML.ORG.CN
      注册:2004/8/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhangsf发送一个短消息 把zhangsf加入好友 查看zhangsf的个人资料 搜索zhangsf在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看zhangsf的博客楼主
    发贴心情 有没有方法可以提取html文件中感兴趣的部分为xml文件?

    比如,我想提取html文件中超级链接地址保存到一个xml文件,该如何实现?
    html文件能转换成xml文件吗?

       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/8/25 22:46:00
     
     孤独 帅哥哟,离线,有人找我吗?
      
      
      威望:7
      等级:大三(面向对象是个好东东!)(版主)
      文章:826
      积分:4220
      门派:XML.ORG.CN
      注册:2004/1/14

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给孤独发送一个短消息 把孤独加入好友 查看孤独的个人资料 搜索孤独在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看孤独的博客2
    发贴心情 
    用正则弄出来然后用xmldom

    ----------------------------------------------
    <?xml version="1.0" encoding="gb2312"?>
    <个人签名>
      <Website>[url=http://www.mahaobo.cn]
    MaHaobo.cn[/url]
    </Website>
    <Email>aloning(at)gmail.com</Email>
      <Qq >32113739</Qq>
    </个人签名>

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/8/28 22:33:00
     
     zhangsf 帅哥哟,离线,有人找我吗?
      
      
      等级:大二期末(数据结构考了98分!)
      文章:53
      积分:417
      门派:XML.ORG.CN
      注册:2004/8/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给zhangsf发送一个短消息 把zhangsf加入好友 查看zhangsf的个人资料 搜索zhangsf在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看zhangsf的博客3
    发贴心情 
    有例子吗?你这样写我还是不懂啊
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/9/1 22:31:00
     
     unill 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:1
      积分:78
      门派:XML.ORG.CN
      注册:2004/4/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给unill发送一个短消息 把unill加入好友 查看unill的个人资料 搜索unill在『 XML源码及示例(仅原创和转载) 』的所有贴子 引用回复这个贴子 回复这个贴子 查看unill的博客4
    发贴心情 
    我用过最笨的办法,就是把html代码不断的替换、再替换;如果你不是很熟悉正则表达式的话可以考虑这一招;
    还有就是象下面这样的代码其实就是标准的xml格式了,完全可以读出来的,所以做的时候往这个方向靠就可以了
    <table border="1" cellpadding="0" cellspacing="1" style="border-collapse: collapse" width="100%" id="table1">
     <tr align=center>
      <td>fdh</td>
      <td>dgh</td>
     </tr>
     <tr >
      <td>df</td>
      <td>dh</td>
     </tr>
     <tr>
      <td>d</td>
      <td>dfh</td>
     </tr>
    </table>
    如果不是标准的代码就用replace大法吧...
    愿意的话可以qq(7779944)交流  :)
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2004/9/1 23:46:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 XML源码及示例(仅原创和转载) 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2025/9/17 8:46:09

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    62.500ms