网络爬虫技术的概述与研究
发布时间:2022-11-29 04:57:49 来源:文档文库
小
中
大
字号:
.....>>>>网络爬虫技术的概述与研究摘要网络爬虫,又被称为网页蜘蛛,网络机器人,随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(SearchEngine,例如传统的通用搜索引擎AltaVista,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问web的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性。为了解决上述问题,定向抓取相关网页资源的聚焦爬虫应运而生。聚焦爬虫是一个自动下载网页的程序,它根据既定的抓取目标,有选择的访问万维网上的网页与相关的,获取所需要的信息。本文将对网络爬虫技术及其原理进行简单的介绍,并且给出实例。关键词网络爬虫聚焦爬虫网页抓取搜索策略URL..优质资料..
..