新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 提高页面的PageRank(页面排名),让页面被Google检索的技巧。站长交换链接。搜索引擎优化(SEO)。Google Analytics,Google Sitemap,Google Related Links。
    [返回] 中文XML论坛 - 专业的XML技术讨论区Android开发论坛『 Google PageRank/Google排名/SEO/Google Analytics 』 → [转帖]手把手教你制作Google Sitemap(详细制作教程和协议讲解) 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 9715 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: [转帖]手把手教你制作Google Sitemap(详细制作教程和协议讲解) 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 Google PageRank/Google排名/SEO/Google Analytics 』 的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 [转帖]手把手教你制作Google Sitemap(详细制作教程和协议讲解)

    http://www.netbei.com/Article/zz/zz6/google/200506/3836.html

    Google Sitemap是什么,请看这篇文章:http://www.netbei.com/Article/zz/zz6/google/200506/3835.html

    熬了半个通宵,写出了自己的Google SiteMap文件,在这里给出详细编写教程,愿对大家有所帮助。

    Google SiteMap的作用及协议格式详解
    Google SiteMap Protocol是Google自己推出的一种站点地图协议,此协议文件基于早期的robots.txt文件协议,并有所升级。在Google官方指南中指出加入了Google SiteMap文件的网站将更有利于Google网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。文件协议应用了简单的XML格式,一共用到6个标签,其中关键标签包括链接地址、更新时间、更新频率和索引优先权。

    Google SiteMap文件生成后格式如下:
    <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
      <url>
        <loc>http://duduwolf.winzheng.com</loc>
        <lastmod>2005-06-03T04:20-08:00</lastmod>
        <changefreq>always</changefreq>
        <priority>1.0</priority>
      </url>
      <url>
        <loc>http://duduwolf.winzheng.com/post/140.html</loc>
        <lastmod>2005-06-02T20:20:36Z</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
      </url>
    </urlset>
    XML标签
    changefreq:页面内容更新频率。
    lastmod:页面最后修改时间
    loc:页面永久链接地址
    priority:相对于其他页面的优先权
    url:相对于前4个标签的父标签
    urlset:相对于前5个标签的父标签
    我将一句一句分解讲解这个xml文件的每一个标签:
    <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">这一行定义了此xml文件的命名空间,相当于网页文件中的<html>标签一样的作用。
    <url>这是具体某一个链接的定义入口,你所希望展示在SiteMap文件中的每一个链接都要用<url>和</url>包含在里面,这是必须的。
    <loc>http://duduwolf.winzheng.com</loc>用<loc>描述出具体的链接地址,这里需要注意的是链接地址中的一些特殊字符必须转换为XML(HTML)定义的转义字符,如下表: 字符 转义后的字符
    HTML字符 字符编码
    and(和) & & &
    单引号 &apos; &apos; '
    双引号 " " "
    大于号 > &gt; >
    小于号 < &lt; <

    <lastmod>2005-06-03T04:20:32-08:00</lastmod><lastmod>是用来指定该链接的最后更新时间,这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:
    年:YYYY(2005)
    年和月:YYYY-MM(2005-06)
    年月日:YYYY-MM-DD(2005-06-04)
    年月日小时分钟:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37+08:00)
    年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30+08:00)
    这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了
    <changefreq>always</changefreq>用这个标签告诉Google此链接可能会出现的更新频率,比如首页肯定就要用always(经常),而对于很久前的链接或者不再更新内容的链接就可以用yearly(每年)。这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了吧,光看单词的意思就明白了。
    <priority>1.0</priority><priority>是用来指定此链接相对于其他链接的优先权比值,此值定于0.0 - 1.0之间
    还有</url>和</urlset>,这两个就是来关闭xml标签的,这和HTML中的</body>和</html>是一个道理
    另外需要注意的是,这个xml文件必须是utf-8的编码格式,不管你是手动生成还是通过代码生成,建议最好检查一下xml文件是否是utf-8编码,最简单的方法就是用记事本打开xml然后另存为时选择编码(或转换器)为UTF-8。


       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/6 0:11:00
     
     caoxia 帅哥哟,离线,有人找我吗?
      
      
      等级:大一新生
      文章:0
      积分:54
      门派:XML.ORG.CN
      注册:2006/5/6

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给caoxia发送一个短消息 把caoxia加入好友 查看caoxia的个人资料 搜索caoxia在『 Google PageRank/Google排名/SEO/Google Analytics 』 的所有贴子 引用回复这个贴子 回复这个贴子 查看caoxia的博客2
    发贴心情 
    有点明白
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2006/5/7
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Google PageRank/Google排名/SEO/Google Analytics 』 的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/4/27 17:46:26

    本主题贴数2,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    46.875ms