首页
位置:首页>新闻动态 > 网站优化 >

使用 rel=canonical 为类似网页或重复网页指定权威网页

1

如果你对 rel=canonical 还未曾了解,那么请先看一看下面这条语句:

1

<link>标签应该知道吧,它是放在<head>里面的一个元素标记,该标签定义文档与外部资源的关系。而rel<link>标签里面的一个属性,canonical则是rel的属性值。

好了,现在进入正题,说明 rel=canonical 的重要性以及如何使用该属性。

使用 rel=canonical 为类似网页或重复网页指定权威网页

如果你的某一个网页可通过多个网址访问,或者你的不同网页包含类似内容(例如,某个网页既有移动版,又有桌面版),那么你应明确告知搜索引擎哪个网址是该网页的权威网址(权威网址)。否则,搜索引擎就会替您做出选择,或会将这两个版本视为完全等同,这可能会导致出现一些不当的行为。

请注意,虽然建议你为重复的网址或版本指定权威网页,但搜索引擎可能会出于各种原因(例如性能或内容)通过算法来选择一个不同的网页作为权威网页。

为什么我的网站上会有类似网页/重复网页?

你的网站上可能会有多个不同的网址指向同一个网页,或者在不同网址上有重复网页或非常类似的网页,这是有正当理由的。以下是最常见的原因:

https://example.com/news/koala-rampage
https://m.example.com/news/koala-rampage
https://amp.example.com/news/koala-rampage
https://www.example.com/products?category=dresses&color=green
https://example.com/dresses/cocktail?gclid=ABCD
https://www.example.com/dresses/green/greendress.html
https://blog.example.com/dresses/green-dresses-are-awesome/
https://blog.example.com/green-things/green-dresses-are-awesome/
http://example.com/green-dresses
https://example.com/green-dresses
http://www.example.com/green-dresses
https://news.example.com/green-dresses-for-every-day-155672.html(转载博文)
https://blog.example.com/dresses/green-dresses-are-awesome/3245/(原始博文)

具体细节

当搜索引擎将某个网站编入索引时,它会尝试确定此网站的每个网页中涵盖的主题。如果爬虫在同一网站上发现了多个似乎包含相同内容的网页,则会选择它认为最完整且实用的那个网页,并将其标记为权威网页。为了节省你网站的抓取预算,爬虫会经常抓取权威网页,而不会频繁地抓取重复网页。因此,如果你不告知爬虫哪个网页是权威网页,并且决定将一个不同的网页(与爬虫所选的网页不同)作为权威网页,那么爬虫便可能不会经常将你费心费力地更新的网页编入索引或在搜索结果中显示该网页。

爬虫会使用你网站上的权威网页作为网站内容的黄金标准对网站内容和质量进行评估,搜索引擎搜索结果通常亦会指向权威网页,除非某个重复网页明显与用户的查询更相符:例如,如果用户使用的是移动设备,那么即使桌面版网页被标记为权威网页,搜索结果也可能会指向移动版网页。

搜索引擎会根据许多因素(或“信号”)来选择权威网页,例如网页是通过 http 还是 https 提供;用户声明的首选网域;网页质量;站点地图中是否显示了相应网址;以及任何“rel=canonical”标签。你不能强制搜索引擎将哪个网页选作权威网页,但可通过使用下文中所述的一种或多种方法来影响它的选择。

为什么一定要指定权威网页

在一组重复网页/类似网页中明确选择权威网页可满足您的诸多需求,具体如下所示:

常用的三种方法指定权威网页

在所有重复网页的代码中分别添加一个 <link> 标记,并使其指向权威网页。

优点:

缺点:


优点:

缺点:


具体方法

若想为重复网址或重复网页/类似网页指定权威网址,请选择下列方法之一。

你可在网页标头中使用 <link> 标记来指明某个网页与另一个网页重复的情况。

假设你想将 https://example.com/dresses/green-dresses 设为权威网址(即是有很多个网址指向该内容),那么你可通过执行以下步骤将此网址指定为权威网址:

1、使用 rel="canonical" link 元素标记所有重复的网页。将属性为 rel="canonical"<link> 元素添加到重复网页的 <head> 部分中,并使其指向权威网页,如下所示:

<link rel="canonical" href="https://example.com/dresses/green-dresses" />

2、如果权威网页有对应的移动版变体,请为其添加 rel="alternate" 链接,并使其指向此网页的移动版:

<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

如果你能配置自己的服务器,则可使用 rel="canonical" HTTP 标头(而非 HTML 标记)为非 HTML 文档(例如 PDF 文件)指明权威网址。

例如,如果你通过多个网址显示某个 PDF 文件,则可为重复的网址返回如下 rel="canonical" HTTP 标头,以将该 PDF 文件的权威网址告知爬虫:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

对于 rel="canonical" link 元素,请使用绝对路径(而非相对路径)。
建议使用的结构:https://www.example.com/dresses/green/greendresss.html
不建议使用的结构:/dresses/green/greendress.html

如果你想移除现有的重复网页,但需要确保在停用旧网址之前顺利完成迁移,请使用此方法。

假定用户可通过以下几种方式访问您的网页:

https://example.com/home
https://home.example.com
https://www.example.com

你可从这些网址中挑选一个作为权威网址,并使用 301 重定向将来自其他网址的流量引导至你的首选网址。服务器端 301 重定向是确保将用户和搜索引擎定向到正确网页的最佳方式。301 状态代码表示相应网页已永久地迁移到新位置。

无论使用哪种方法,都请务必遵守如下常规指南


搜索引擎会优先选择 HTTPS 网页(而非等效的 HTTP 网页)作为权威网址,除非存在如下问题或冲突信号:

虽然搜索引擎在默认情况下会优先选择 HTTPS 网页(而非 HTTP 网页),但你可通过执行以下任一操作来确保此行为始终都会发生:

为防止搜索引擎误将 HTTP 网页选为权威网页,你应避免以下几种做法:

上一篇:当涉及到SEO优化、提升网站的搜索引擎优化(SEO)排名时可以考虑以下操作

下一篇:百度搜索违规低质页面问题说明