`
solorez
  • 浏览: 237797 次
  • 性别: Icon_minigender_1
  • 来自: 郑州
社区版块
存档分类

巧妙地处理内容重复

阅读更多
用户经常问我们关于重复内容的问题。以下文章翻译自谷歌网络管理员中心英文官方博客。作者是Adam Lasnik, 谷歌搜索布道者。发表于2006年12月18日。

原文 Deftly dealing with duplicate content

最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。我们想在此予以澄清。

什么是内容重复?

重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的URL上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。

什么不是重复内容?

虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。

为什么谷歌关心重复内容?

谷歌用户使用Google时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站管理员不愿意看到Google给出象example.com/contentredir?value=shorty-george〈=en一样复杂的URL。他们往往更喜欢类似example.com/en/shorty-george.htm的URL。

谷歌做了些什么?

Google在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,如果你的网站有文章的正常版和打印版,并且你没有在robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会在对相关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上... 因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。

网站管理员如何主动处理内容复制问题?
  • 适当阻止搜索引擎访问:与其让我们的算法来确定一个文件的"最佳"版本,你也许希望指引谷歌选取你的首选版本。譬如说,如果你不想我们索引你网站文章的打印版,你可以在你的robots.txt文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。
  • 使用301重定向:如果你已经重构你的网站,请在你的原网站的.htaccess中使用301重定向(永久性重定向)来重定向你的用户、Google爬虫、以及其他搜索引擎蜘蛛等。
  • 链接要一致:努力使你的内部链接保持一致; 不要既有/page/,又有/page和/page/index.htm 的内部链接.
  • 使用顶级域名:为了让我们总是使用最合适的文件版本, 请尽可能使用国家特定的顶级域名。与诸如example.com/de或de.example.com的URL相比,谷歌肯定更清楚地知道example.de是以德文为核心的内容。
  • 小心辛迪加式的联合供文:如果你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接。注意:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
  • 使用谷歌网站管理员工具的首选域功能: 如果其他网站链接你的URL时既使用www版本又使用无www的版本,你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式。
  • 减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。
  • 避免发布无内容页:用户不喜欢看到无实际内容的页面。要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等。只有这样,网站用户(以及Google爬虫)才不会看到无穷多的写着“以下是在【某城市名】中不可错失的待租房列表...”但其实根本没有什么列表的网页。
  • 了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统。往往在这些系统中同一内容会以多种形式出现。
  • 不要担心,保持快乐:不要过分受搜刮(挪用和转载)你内容站点的干扰。虽然很恼人, 它们几乎不可能对你在谷歌中的存在产生负面影响。如果你实在忍无可忍, 欢迎你提出千禧年著作权法案申请来声明对你的内容的所有权。我们会处理那些无赖网站。
总之, 如果你对内容复制问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容。

较早对“巧妙地处理内容重复”的40个评论存档
分享到:
评论

相关推荐

    Excel 2021中对重复数据的巧妙处理.docx

    Excel 2021中对重复数据的巧妙处理.docx

    在Excel 2021中对重复数据进行巧妙处理.docx

    在Excel 2021中对重复数据进行巧妙处理.docx

    使用Access巧妙合并多个Excel文件.docx

    使用Microsoft Access可以巧妙地合并多个Excel文件,从而提高工作效率和数据分析能力。下面我们将详细介绍如何使用Access来合并多个Excel文件。 使用Access合并多个Excel文件的步骤 1. 在Access中创建对Excel工作...

    Excel_2007_技巧篇

    Excel 2007 中对重复数据的巧妙处理 67 Excel 2007 中选择一个或多个工作表 69 管理 Excel2007 条件格式规则的优先级 69 Excel2007 实现双面打印的两种另类方法 70 Excel2007 帮您处理信息的十种主要方式 72 添加...

    基于Spring Cloud + MyBatis的分布式架构网约车平台(DD 打车)后端原型系统设计与实现.zip

    Spring Cloud利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等,还可以将Spring Boot的开发风格做到一键启动和部署。...

    Office2010Excel经典视频教程(45集打包下载).zip

    45巧妙处理折线图表中的断裂问题.wmv 44轻松打破数据透视表中的常规排序.wmv 43智能的搜索筛选器.wmv 42巧用Excel记录单.wmv 41添加工作表背景.wmv 40常用函数.wmv 3_动态洞察数据的切片器.wmv 39Excel图表里两个Y轴...

    word使用技巧大全

    内容主要包括: word使用技巧;公式编辑技巧;页眉页脚技巧;目录处理技巧;参考文献格式排版技巧,word画图技巧,word转PDF等等。 下面是本资源的详细目录! ============================================= 目录 I...

    VC学习大纲 VC学习讲义

    如何在主对话框程序启动时立即隐藏对话框的巧妙实现方式与精妙思想(不能直接在OnInitDialog处理。包括自定义消息的实现) 第十课: 如何制作属性页对话框和向导对话框,融合讲解组合框(如何调整组合框的大小)、...

    游戏开发中的人工智能.pptx

    不断重复该过程,直到整个字节码流都被执行后结束。由此可知,操作仅需要堆栈和指令指针(用来指向字节码流中将被执行的下一条指令)。 游戏开发中的人工智能是游戏开发过程中的一个关键组件,它可以让游戏设计师而...

    近乎v5.0源码 Almostv50.rar

    v5.0对SQL注入、跨站脚本攻击(XSS)、跨站请求伪造(CSRF)等主要威胁进行了系统的处理,实现了灵活、细致的权限管理功能,充分构筑了应用程序级安全。 8、易于扩展,便于开发 v5.0站点导航可自定义、可快速增加...

    Android中View自定义组合控件的基本编写方法

    或者大家在做项目时候会发现,某些布局会被重复的利用,同一个布局的XML代码块会被重复的复制黏贴多次,这样会造成代码结构混乱不说,代码量也会增大,各种控件都需要在Java代码中被申明和处理相应的逻辑,工作量...

    华为编程开发规范与案例

    为了进行数据库异常测试,于是将数据库内容人为地破坏了。发现在对数据库进行比较操作时,出现程序跑死了现象。 经过跟踪调试发现问题出现在如下一段代码中: 1 for(i=0; i<pSysHead->dbf_count; i++) 2 { 3 ...

    数据结构经典问题和算法分析

    这样,程序可从i=0或i=1出发,重复地,由已知至i-1规模的解,通过递推,获得规模为i的解,直至得到规模为N的解。 四、递归 递归是设计和描述算法的一种有力的工具,由于它在复杂算法的描述中被经常采用,为此在...

    leetcode不会-leetcode:leetcode

    它巧妙地使用索引。 但是在最后一个时期,我遇到了这个问题。 当nums为[3,3],目标为6时,此时我的函数返回[1,1],所以在“if()”中添加“m[t]!=i”条件很有用. 我不想提供不必要的细节,因为它在网站上有很多。 ...

    VBSCRIPT中文手册

    你就能学会如何巧妙地运用 VBScript 语言,充分发挥 VBScript 语言的强大功能。 特性 说明 VBScript 特性 VBScript 最新特性列表 未包含在 VBScript 中的 VBA 特性 VBScript 最新特性列表:未包含在 VBScript ...

    vb Script参考文档

    你就能学会如何巧妙地运用 VBScript 语言,充分发挥 VBScript 语言的强大功能。 特性 说明 VBScript 特性 VBScript 最新特性列表 未包含在 VBScript 中的 VBA 特性 VBScript 最新特性列表:未包含在 VBScript ...

    PHP和MySQL Web开发第4版pdf以及源码

    1.2.2 表单处理 1.3 在HTML中嵌入PHP 1.3.1 使用PHP标记 1.3.2 PHP语句 1.3.3 空格 1.3.4 注释 1.4 添加动态内容 1.4.1 调用函数 1.4.2 使用date()函数 1.5 访问表单变量 1.5.1 简短、中等以及长风格的...

    PHP和MySQL WEB开发(第4版)

    1.2.2 表单处理 1.3 在HTML中嵌入PHP 1.3.1 使用PHP标记 1.3.2 PHP语句 1.3.3 空格 1.3.4 注释 1.4 添加动态内容 1.4.1 调用函数 1.4.2 使用date()函数 1.5 访问表单变量 1.5.1 简短、中等以及长风格的表单变量 ...

    Hibernate实战(第2版 中文高清版)

     10.3.2 使用Hibernate非事务地工作   10.3.3 使用JTA的可选事务   10.4 小结   第11章 实现对话   11.1 传播Hibernate Session   11.1.1 Session传播的用例   11.1.2 通过线程局部传播   11.1.3 ...

    PHP和MySQL Web开发第4版

    1.2.2 表单处理 1.3 在HTML中嵌入PHP 1.3.1 使用PHP标记 1.3.2 PHP语句 1.3.3 空格 1.3.4 注释 1.4 添加动态内容 1.4.1 调用函数 1.4.2 使用date()函数 1.5 访问表单变量 1.5.1 简短、中等以及长风格的...

Global site tag (gtag.js) - Google Analytics