当前位置：系统迷 > 技术教程 > 正文

什么是爬虫

2019-12-21 分类：技术教程评论(1)

在日常生活领域，爬虫指的是一种普通昆虫。而在互联网领域，爬虫指的则是抓取网页数据的相关技术。

它可以模拟人的行为去各个网站溜达，然后把看到的数据背回来，就像是一只爬来爬去的虫子一样。

什么是爬虫

大家经常在使用的百度、谷歌等搜索引擎，在抓取网站数据时，就是运用了这项技术。

正规的网络爬虫不会随意乱抓取数据，它们会遵循一定的规则。

而恶意的爬虫则是毫无节制地扫描，比如12306抢票软件。它们恨不得每秒扫个几万次，因为这样能提高抢票成功率。

要知道，如此恶意扫描，对网站的运行是有很大影响的。它们会耗费大量服务器资源，影响正常用户访问。

当然，企业也会通过一些方法，来处理恶意爬虫。比如添加图片验证码、封禁IP、通过Web应用防火墙来防护等。

赞(27)

转载请注明来源：系统迷 » 什么是爬虫

标签：什么是爬虫爬虫网络爬虫

相关推荐

评论 1

#0
大哥，八爪鱼有吗

鲸落5年前 (2020-09-10)回复

系统迷更专业的互联网分享平台