richardmyu / blog

个人(issues)博客
https://github.com/richardmyu/blog/issues
MIT License
0 stars 0 forks source link

a 链接的 rel 属性探究 #2

Open richardmyu opened 5 years ago

richardmyu commented 5 years ago

日常打开 github

偶然的样式问题?

发现个人信息的链接有样式问题:

rel_01

于是打开控制台查看,发现是由类名 MSI_ext_nofollow 带来的:

rel_02

去掉类名试试:

rel_03

再看看页面:

rel_04

然后我还发现这一类 a 标签,均带有 rel="nofollow" 的属性,而其他正常的 a 标签既没有该属性,也没有 MSI_ext_nofollow 类名,同样的情况我也在拉钩网上见到:

rel_05

rel_06

到这里,就不追问为什么会出现这样的样式问题,我们把重点转向 rel="nofollw"

rel="nofollow"?

1.rel 属性

rel 属性指定了目标对象到链接对象的关系。该值是空格分隔的列表类型值。[1]

Relationship between the location in the document containing the hyperlink and the destination resource. from

The rel attribute specifies the relationship between the current document and the linked document.Only used if the href attribute is present.[2]

2.nofollow 定义

nofollow 是一个 HTML 标签(元标签 (meta) 的 content 属性和链接标签 (a) 的 rel 属性)的一个属性值。这个标签的意义是告诉搜索引擎“不要追踪此网页上的链接”或“不要追踪此特定链接”。nofollow 标签是由谷歌领头创新的一个“反垃圾链接”的标签,并被百度、yahoo 等各大搜索引擎广泛支持,引用 nofollow 标签的目的是:用于指示搜索引擎不要追踪(即抓取)网页上的带有 nofollow 属性的任何出站链接,以减少垃圾链接的分散网站权重![3]

但是如果你是通过 sitemap 直接提交该页面,爬虫还是会爬取,这里的 nofollow 只是当前页对目标页的一种态度,并不代表其他页对目标页的态度。[4]

反向链接即外链是搜索引擎给网站排名的一个重要因素。为了添加反向链接,SEO 作弊者会在论坛和博客等大量发布带无关链接的内容。这些垃圾链接的存在给搜索引擎对网页质量的评估造成一定程度的麻烦,可以说 nofollow 是一个非常好的“垃圾链接防火墙”。正是百度、谷歌、Yahoo、MSN 为了应对垃圾链接(Spam link)引入的一个属性,此属性应该被广泛采用。在网站中,为 UGC 中的链接自动添加 nofollow 属性,是各大网站和站长惯用的方法。因此,用发链接的方法来增加外链,效果已经大打折扣了。[3]

一般常见的用法:

//meta: 告诉爬虫该页面上所有链接都无需追踪
<meta name="robots" content="nofollow" />

// a: 告诉爬虫该页面无需追踪
<a rel="nofollow" href="......">链接内容</a>
<a rel="external nofollow" href="......">链接内容</a>

3.nofollow 用途

nofollow 主要有三个作用:

4.PR 修剪(Pagerank Sculpting)

4.1.什么是 PR

谷歌 PR 是 Page Rank 的简称,PR 值的概念由谷歌的两位创始人 Larry Page 和 Sergey Brin 开发出来的,Page Rank 就是 佩奇级别,也叫做 网页级别。在当时的互联网界引起了巨大的轰动效应,至今一直被沿用追捧,并且成为网站排名因素当中的一个重要组成部分。[6]

PR 值从 1-10 共有 10 个等级,数字越大,说明该网页越重要越受欢迎,反之亦然。提高 PR 的主要途径:增加指向你网站的高质量外部链接,以及内部链接,数量和质量越多,所能传递的权重也就越高。[6]

4.2.Pagerank Sculpting

nofollow 的滥用,一些 SEO 为了做到搜索引擎的最大优化,通过 nofollow 来控制 PR 的流动,可以很好的优化一些特定页面。当然这种优化比较适合一些已经积淀了相当数量 PR 的老站点。为了防止 PR 修剪和 nofollow 的滥用,Google 已经减弱了 nofollow 的作用,以前的 nofollow 不仅仅不会造成 PR 流动,同时不会造成 PR 损失,现在的 nofollow 规定虽然也不会造成 PR 流向目标页,但是原本流向的目标页的将会损失掉。比方当前页 PR 为 1,而且页面上有 10个 链接,其中一个是 nofollow 的链接,根据先前的 nofollow 的规定,每个非 nofollow 链接指向的目标页将获得 1/9 的 PR,含 nofollow 的链接不能获得 PR,而根据现在 Google 对 nofollow 的新规定,非 nofollow 链接指向的目标页只能获得 1/10,nofollow 链接同样不能获得 PR,也就是损失了 1/10 的 PR。[4]

后记

现状:国内网站对PR值的依赖越来越小,并且PR值针对国内网站已经很长时间不更新了,对于2013年以后新上的网站来说,已经没有太大的参考价值了。[7]


参考:

1. <a>

2.HTML <a> rel Attribute

3.HTML中的A标签的nofollow属性解读

4."rel=nofollow"属性

5.rel=”nofollow”的用途

6.什么是谷歌PR值

7.谷歌PR值是什么,百度权重是否重要,如何查询?

8.Nofollow vs. Follow Links: Everything You Need to Know

9.Follow Links Vs. No Follow Links: Should You Care?

10.Infographic: What Is The Nofollow Tag; When & How To Use It