通过设定.htaccess和nginx.conf禁止恶意User Agent网页爬虫
![]() | ![]() | ![]() | ![]() |
| 【性价之王】 | 【线路之王】 | 【价格之王】 | 【配置之王】 |
| 【免费之王】 | 【香港首推】 | 【梯子之王】 | 【独服之王】 |

不知道我们各位朋友们的网站是否有出现流量不大,但是我们的主机商会告诉我们某个时间段的时候网站被大量的攻击导致内存占据超标,要求我们处理。同样的,如果我们自己在使用VPS主机环境建站的时候,有些时候因为模拟蜘蛛的抓取、采集,以及有些空User Agent爬虫的抓取,会导致服务器压力较大,内存一直处于较高的占用状态。
往往这样大部分的原因是因为有些被恶意或者故意的User Agent蜘蛛抓取导致的服务器内存占用超过导致网站的访问不能正常,我们可以通过设定.htaccess(Apache服务器)和nginx.conf(Nginx服务器)来解决这些问题。
我们要善于分析网站的日志,在日志中,我们可能会看到有很多来路不明的蜘蛛(搜索引擎之外的蜘蛛我们都可以屏蔽),我们只需要屏蔽掉就可以解决这些问题。
第一、Apache环境
如果我们的虚拟主机、VPS服务器,采用的是Apache环境,我们可以在网站根目录的.htaccess文件进行设置。
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (^$|FeedDemon|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms) [NC]
RewriteRule ^(.*)$ – [F]
修改我们网站的.htaccess文件,屏蔽一些没有必要的蜘蛛User Agent。这里我们较为常用的是屏蔽空User Agent。
RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} ^$
RewriteRule ^(.*)$ – [F]
第二、Nginx环境
Nginx环境的配置不能像Apache直接在网站根目录的配置文件丢上禁止爬虫的文件,需要在Nginx.conf文件中处理。
1、新建agent_deny.conf
vi /usr/local/nginx/conf/agent_deny.conf
在上面目录中创建一个新的.conf文件。
if ($http_user_agent ~* \\”WinHttp|WebZIP|FetchURL|node-superagent|java/|FeedDemon|Jullo|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhsBot|CrawlDaddy|Java|Feedly|Apache-HttpAsyncClient|UniversalFeedParser|ApacheBench|Webbench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|BOT/0.1|YandexBot|FlightDeckReports|Linguee Bot|Scrapy|Curl|wget\\”) {
return 403;
}
if ($request_method !~ ^(GET|HEAD|POST)$) {
return 403;
}
2、添加调用文件
然后我们在/usr/local/nginx/conf/站点配置文件.conf中添加:
include agent_deny.conf;
在server中添加就可以。
3、重启Nginx
根据我们使用的环境重启nginx或者重启VPS也可以。
总结,这样通过上面的方法,我们可以对自己网站环境的Nginx或者Apache网站结构进行部署屏蔽恶意、无用User Agent爬虫。
[User Agent]历史优惠活动内容
猜你可能想看的VPS
- Meihezi→59 元 月 KVM-1GB 30GB 5M 无限 南非全球[VPS测评]
- 降价 鲨鱼机房服务器直降 500 美元 免费 DDos 防御 shark全球[VPS测评]
- 薅羊毛 ikoula 送 100 欧元 可以免费撸 2 年的 VPS 目美国VPS[主机]
- 大硬盘 €15 年 512M 内存 128G 硬盘 500G 流量 1G全球[VPS测评]
- 限时促销 $24 年 2 核 CPU 2G 内存 20G SSD 5T 全球[VPS测评]
- hostkvm - 大带宽香港 VPS 2 核 2G 内存仅 68 元 香港VPS[主机]
- 彩虹数据日本 CN2 GIA VPS 速度及综合性能测评,最高 30M 日本VPS[主机]
- KVMLA→香港 日本 新加坡 VPS 年付 7 折 月付 8 折 内存日本VPS[主机]
- W3Space→$15 年 1GB 内存 25GB SSD 空间 1.5虚拟空间(主机)
- 劳动节 vpsyc→6 折优惠 美国 cn2 gia VPS 200Mb美国VPS[主机]
- 6yun→45 元 月 256MB 内存 5GB 空间 2TB 流量 1虚拟空间(主机)
- 如何为WordPress友情链接设置 nofollow 属性?全球[VPS测评]
- 如何在 CentOS 7 服务器上使用 yum命令安装 PHP7.2全球[VPS测评]
- anyhk → 31元月付 美国洛杉矶9929 1C1G10GB硬盘 1美国VPS[主机]
- SaltyFish(咸鱼云)美西CN2 GIA VPS复活节82折优惠 全球[VPS测评]
- 阿里行癫:如何理解当下的云计算全球[VPS测评]
- JGKVM(极光kvm),便宜香港VPS(5G防御秒解),极光互联vps香港VPS[主机]
- 20个温暖心灵的问题,抖音,朋友圈都可以拿去发。全球[VPS测评]
- VPS成立BurjeelHoldings全球[VPS测评]
- HostXen:双十一新用户香港、日本vps,送20元代金券,充值300日本VPS[主机]
- 磐逸云怎么样?香港沙田cn2vps 带宽5M年付128元香港VPS[主机]
- 野草云怎么样?香港、美国圣何塞高防VPS 1核1G3M 月付19元美国VPS[主机]
- wikihost,微基主机服务,100M带宽香港CMIVPS,5G防御,香港VPS[主机]
- edgenat:韩国cn2+香港cn2,VPS八折优惠,8核8G/50gWINDOWS
- 潮科技|阿里云发布第七代高主频云服务器ECS和含光800云服务器全球[VPS测评]
- 快速云:科普云服务器服务器的概念和作用2022-08-2313:26来源全球[VPS测评]
- 外贸无界烟台市有多少跨境电商?烟台跨境电商开发平台,烟台跨境电商选品全球[VPS测评]
- 紫云服务器怎么样?紫云香港云服务器1核1G2M仅65元/月香港VPS[主机]
- cmivps:香港不限流量VPS,2核2G仅218元/年,支持WindoWINDOWS
- 柚子互联:美国洛杉矶CN2 vps,防御100G/带宽10M,28元/月美国VPS[主机]
转载请注明原文地址:http://140.238.13.167:12355/read-142255.html











