通过设定.htaccess和nginx.conf禁止恶意User Agent网页爬虫
![]() | ![]() | ![]() | ![]() |
| 【性价之王】 | 【线路之王】 | 【价格之王】 | 【配置之王】 |
| 【免费之王】 | 【香港首推】 | 【梯子之王】 | 【独服之王】 |

不知道我们各位朋友们的网站是否有出现流量不大,但是我们的主机商会告诉我们某个时间段的时候网站被大量的攻击导致内存占据超标,要求我们处理。同样的,如果我们自己在使用VPS主机环境建站的时候,有些时候因为模拟蜘蛛的抓取、采集,以及有些空User Agent爬虫的抓取,会导致服务器压力较大,内存一直处于较高的占用状态。
往往这样大部分的原因是因为有些被恶意或者故意的User Agent蜘蛛抓取导致的服务器内存占用超过导致网站的访问不能正常,我们可以通过设定.htaccess(Apache服务器)和nginx.conf(Nginx服务器)来解决这些问题。
我们要善于分析网站的日志,在日志中,我们可能会看到有很多来路不明的蜘蛛(搜索引擎之外的蜘蛛我们都可以屏蔽),我们只需要屏蔽掉就可以解决这些问题。
第一、Apache环境
如果我们的虚拟主机、VPS服务器,采用的是Apache环境,我们可以在网站根目录的.htaccess文件进行设置。
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (^$|FeedDemon|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms) [NC]
RewriteRule ^(.*)$ – [F]
修改我们网站的.htaccess文件,屏蔽一些没有必要的蜘蛛User Agent。这里我们较为常用的是屏蔽空User Agent。
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^$
RewriteRule ^(.*)$ – [F]
第二、Nginx环境
Nginx环境的配置不能像Apache直接在网站根目录的配置文件丢上禁止爬虫的文件,需要在Nginx.conf文件中处理。
1、新建agent_deny.conf
vi /usr/local/nginx/conf/agent_deny.conf
在上面目录中创建一个新的.conf文件。
if ($http_user_agent ~* \”WinHttp|WebZIP|FetchURL|node-superagent|java/|FeedDemon|Jullo|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhsBot|CrawlDaddy|Java|Feedly|Apache-HttpAsyncClient|UniversalFeedParser|ApacheBench|Webbench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|BOT/0.1|YandexBot|FlightDeckReports|Linguee Bot|Scrapy|Curl|wget\”) {
return 403;
}
if ($request_method !~ ^(GET|HEAD|POST)$) {
return 403;
}
2、添加调用文件
然后我们在/usr/local/nginx/conf/站点配置文件.conf中添加:
include agent_deny.conf;
在server中添加就可以。
3、重启Nginx
根据我们使用的环境重启nginx或者重启VPS也可以。
总结,这样通过上面的方法,我们可以对自己网站环境的Nginx或者Apache网站结构进行部署屏蔽恶意、无用User Agent爬虫。
[User Agent]历史优惠活动内容
猜你可能想看的VPS
- 极光 KVM→国庆促销 三网 CN2 GIA 包年 199.8 元 年 全球[VPS测评]
- PHPExcel 读取 excel 中的日期返回数字的解决办法全球[VPS测评]
- 疯狂猜成语 图猜成语七个脚印上写着轻舟已过万重山是什么成语?全球[VPS测评]
- 企鹅小屋→350 元 月 E3-12XX 16GB 内存 1TB 硬盘 香港VPS[主机]
- 黑色星期五 sharktech→10G 不限量国内直连服务器超低价全球[VPS测评]
- Kuai Che Dao→$168 季 1GB 内存 10GB SSD 虚拟空间(主机)
- 超值 腾讯云助力复工→香港 1 核 1G 3M 带宽机器年付 299 元香港VPS[主机]
- Name.com 4 月域名促销全球[VPS测评]
- Krypt→iON 品牌 快闪优惠来袭 过时不候[机房直营|稳定建站|C全球[VPS测评]
- 支付宝领加油红包 充值话费可叠加全球[VPS测评]
- [优惠]CloudCone 1810 闪购全球[VPS测评]
- 18%折扣! → 咸鱼云 → 圣何塞 Elite 9929 → 1G内存全球[VPS测评]
- Wikihost(idc.wiki) → 香港沙田Gen2 大宽带大流香港VPS[主机]
- 曾经最大跨境电商平台团队收缩,只剩20人丨GoingGlobal周报全球[VPS测评]
- 从阿里云七代云服务器,谈云计算四大趋势全球[VPS测评]
- edgeNAT双十二:韩国VPS/美国CN2/香港CN2VPS主机,月付韩国VPS[主机]
- 56云服务器怎么样?56云免备案香港云服务器价格多少钱?香港VPS[主机]
- 147SEO采集器 CSS选择器写法案例全球[VPS测评]
- 汇速云:香港沙田CN2云主机,2核CPU带宽1M月付6元,2核2M带宽月香港VPS[主机]
- 福州职业技术学院获得世界职业院校技能大赛云计算赛项银牌全球[VPS测评]
- UCloud优刻得云服务器建站教程:香港云服务器购买优惠方法香港VPS[主机]
- 景文互联年终特惠:日本/香港/美国VPS全场7折+送内存,充1000送3日本VPS[主机]
- 磐逸云:深圳/大连/成都/香港机房vps,1核1G3M仅26元/月,65香港VPS[主机]
- EdgeNat双十二优惠:韩国/香港/美国全场VPS年付,2核2G2M仅韩国VPS[主机]
- 青云互联:年终特惠香港弹性云服务器15元/月起,可自定义配置,可选winWINDOWS
- 蓝米云:美国cera vps/香港cn2vps套餐,1核2G/40G/1美国VPS[主机]
- 潮科技|阿里云发布第七代高主频云服务器ECS和含光800云服务器全球[VPS测评]
- 40火伞高压电爬坡更让企业用电于民全球[VPS测评]
- 阿里云香港服务器价格优惠:老用户香港2核4G3M云服务器仅1181.5元香港VPS[主机]
- 如何根据业务需求选择合适的云服务器配置?全球[VPS测评]
转载请注明原文地址:http://140.238.13.167:12355/read-39254.html











