伪静态规则拦截/屏蔽/限制蜘蛛抓取 适用于Apache、IIS

Ourboke
Ourboke
Ourboke
578
文章
147
评论
2021年7月15日08:01:42
评论
46

最近发现服务器一些垃圾蜘蛛十分可恨,浪费占用大连服务器资源,根本不顾服务器的性能,有多大劲就使多劲,不停的抓取,而且无视Robots协议。

伪静态规则拦截/屏蔽/限制蜘蛛抓取 适用于Apache、IIS

伪静态规则拦截/屏蔽/限制蜘蛛抓取 适用于Apache、IIS

不过可以用伪静态来实现屏蔽蜘蛛!下面介绍方法:

Windows 2008系统IIS7、IIS7.5环境下Web.config,如果没有伪静态组件,得先安装伪静态组件。

    <rule name="Block spider">
    <match url="(^robots.txt$)" ignoreCase="false" negate="true" />
    <conditions>
    <add input="{HTTP_USER_AGENT}" pattern="Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot" ignoreCase="true" />
    </conditions>
    <action type="CustomResponse" statusCode="403" statusReason="Forbidden" statusDescription="Forbidden" />
    </rule>

Linux系统apache环境下规则文件.htaccess(如没有可手工创建.htaccess文件到站点根目录)加入以下代码:

    <IfModule mod_rewrite.c>
    RewriteEngine On
    #Block spider
    RewriteCond %{HTTP_USER_AGENT} "Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|curl|perl|Python|Wget|Xenu|ZmEu" [NC]
    RewriteRule !(^robots\.txt$) - [F]
    </IfModule>

Windows 2003下IIS6.0环境下规则文件httpd.conf或者httpd.ini(在服务器或者虚拟主机控制面板中用“ISAPI筛选器自定义设置"开启自定义伪静态Isapi_Rewite3.1或者免费版)加入以下代码:

    #Block spider
    RewriteCond %{HTTP_USER_AGENT} (Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|mail.RU|curl|perl|Python|Wget|Xenu|ZmEu) [NC]
    RewriteRule !(^/robots.txt$) - [F]

注意:规则中默认的是不明搜索蜘蛛,要屏蔽其它蜘蛛按规则添加替换即可,至于各大搜索引擎蜘蛛的名字可以在度娘当中获得。

茫茫人海能够相遇便是缘分,但请记住;尊重每一份辛勤的汗水,所以转载请注明出处,谢谢!
Ourboke
  • 本文由 发表于 2021年7月15日08:01:42
  • 转载请务必保留本文链接:https://www.ourboke.com/2833.html
如何利用宝塔面板来配置网站php环境? 网站建设

如何利用宝塔面板来配置网站php环境?

之前跟大家聊过一些404页面设置,301重定向跳转等等,今天想跟大伙来聊聊如何利用宝塔面板来配置网站php环境。其实方法也很简单,一起来学习下吧: 如何利用宝塔面板来配置网站php环境...
如何测试网站的打开速度? 网站建设

如何测试网站的打开速度?

网页页面的载入速度对站点的排名有加分。搜索引擎会给能更快打开的站点更佳的排名。当然了,这也是当中一个因素,也就是说,当你的站点的内容质量与其他站点相似时,你的站点的载入速度比其他站点快,那么你的站点就...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: