搜索引擎优化-排除重复内容

原創

骑乌龟的小蜗牛

2018-08-31 18:24

1.使用Robots meta标签

使用robots meta标签，就可以从网站中以网页为基础排除基于HTML的内容。为了用meta来排除页面，只需简单地将以下代码插入到要排除的HTML文档的<head>节

<meta name="robots" content="noindex,nofollow" />

这就表明页面不能被索引，并且页面的链接不能被跟随。

2.robots.txt模式排除

meta标签有技术限制，必须对应用程序源代码修改，而且只能用HTML。

robots.txt是位于网站根目录下的文本文件，并符合robots.txt标准。3个基本概念：

（1）只能有一个robots.txt

（2）robots.txt应放在web站点的根目录下

（3）位于子目录下的robots.txt无效果

下面位于站点根文件夹下的robots.txt文件示例，不允许任何robots(*)访问站点的文件：

User-agent:*

Disallow:/

以下示例不允许任何以“/directory”开头的URL地址被Google索引(googlebot是谷歌的用户代理名)：

User-agent:googlebot

Disallow:/directory

如果只希望directory文件夹下的内容被排除，/directory/

如果想要googlebot排除X,Y,Z，应该这样写：

User-agent:*

Disallow:X

Disallow:Y

User-agent:googlebot

Disallow:X

Disallow:Y

Disallow:Z

只允许google来检索站点：

User-agent:googlebot

Disallow:

User-agent:*

Disallow:/

3.实时生成robots.txt

web开发人员可以实时动态地程序化生成robots.txt文件。在.htaccess中包括以下规则，能够把robots.php映射成robots.txt，并使用脚本robots.php来生成后者。

.htaccess里的以下规则，将对robots.txt的请求重写到robots.php：

RewriteEngine On

RewriteRule ^robots.txt$ /robots.php

robots.php文件：

<?

header('Content-type:text/plain');

...

...

?>

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

微服务实践Aspire项目发布到远程k8s集群

前提你必須會創建aspire項目，不會的請先看微服務新體驗之Aspire初體驗 Aspirate (Aspir8) Aspirate 是將aspire項目發佈到k8s集羣的工具安裝aspirate dotnet tool install

2024-06-02 14:24:56

微服务实践之使用 Visual Studio 2022 调试Dapr 应用程序

安裝配置相關軟件安裝 PowerShell 7 / Core dotnet tool install --global PowerShell 安裝 Visual Studio 擴展 Microsoft Child Process Deb

2024-06-02 14:24:56

.NET开源、跨平台、使用简单的面部识别库

前言今天給大家分享一個.NET開源（MIT License）、免費、跨平臺（適用於 Windows、MacOS 和 Linux ）、使用簡單的面部識別庫：FaceRecognitionDotNet。項目介紹 FaceRecogniti

2024-06-02 14:21:55

Python 潮流周刊#53：我辈楷模，一个约见诺奖得主，一个成为核心开发者

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期週刊分享了 12

豌豆花下貓

2024-06-02 14:19:15

Terraform管理OpenStack

官方安裝指南 https://developer.hashicorp.com/terraform/install https://developer.hashicorp.com/terraform/intro/getting-sta

2024-06-02 14:13:44

matlab练习程序（LQR路径跟踪）

LQR 是一種優化控制方法，設計目標是找到一組控制輸入，使得線性系統的狀態軌跡儘可能地接近目標，同時使控制輸入儘可能小。其目標函數是一個二次型成本函數。分爲以下幾個步驟： 1. 設系統動態方程爲：其中x爲狀態量，u爲控制輸入，A和B爲

2024-06-02 14:11:04

h32 Most commonly used tags in HTML

Most commonly used tags in HTML Last Updated : 08 Mar, 2024 Most commonly used tags in HTML refer to HTM

2024-06-02 14:10:23

css45 CSS Math Functions

https://www.w3schools.com/css/css_math_functions.asp The CSS math functions allow mathematical expressions to be used

2024-06-02 14:10:23

CSS tutorials (w3school)

CSS tutorials (w3school) https://www.schoolsw3.com/css/index.php (Русский язык) https://www.w3schools.com/css/css_intro

2024-06-02 14:10:23

css44 CSS The !important Rule

https://www.w3schools.com/css/css_important.asp What is !important? The !important rule in CSS is used to add more imp

2024-06-02 14:10:23

css41 CSS Website Layout

https://www.w3schools.com/css/css_website_layout.asp Website Layout A website is often divided into headers, menus, co

2024-06-02 14:10:23

css39 CSS Forms

https://www.w3schools.com/css/css_form.asp The look of an HTML form can be greatly improved with CSS: <!DOCTYPE html>

2024-06-02 14:10:23

css40 CSS Counters

https://www.w3schools.com/css/css_counters.asp CSS counters are "variables" maintained by CSS whose values can be inc

2024-06-02 14:10:23

css43 CSS Specificity

https://zhuanlan.zhihu.com/p/670589063 CSS Specificity(CSS 特異性)是一個用來決定當多個CSS規則應用於同一個元素時,哪個規則將優先應用的機制。 What is Specific

2024-06-02 14:10:23

css42 CSS Units

https://www.w3schools.com/css/css_units.asp CSS Units CSS has several different units for expressing a length. Many CS

2024-06-02 14:10:23

24小時熱門文章

最新文章

最新評論文章