蜘蛛功能说明

发布时间:2012-04-23 14:45:03   来源:文档文库   
字号:

军长蜘蛛搜索系统使用说明

产品名:军长搜索蜘蛛系统
开发语言:Microsoft.NET 2.0

运行平台:Microsoft winXP,win2000,win2003,Vista, win2008

运行环境:Microsoft .NET Framework v2.0Microsoft .NET Framework v.

推荐环境: win2003(更新补丁)+.NET Framework v2.0

1、产品简介…………………………………………………第1

2、产品安装…………………………………………………第1
3、系统面板介绍……………………………………………1

3、功能说明…………………………………………………第2

4、操作说明…………………………………………………第4

产品简介

军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。

产品适用范围:

行业垂直搜索引擎、大型新闻门户网站站内搜索、大型行业门户网站站内搜索、校园网搜索、企业网搜索、企业内部文件搜索。

,产品安装

准备windows系列操作系统(推荐win2003版操作系统),下载安装Framework v2.0(已安装用户无需重复安装)。


解压蜘蛛程序压缩包,本软为绿色软件无须安装,解压后请直接打开运行JZbaidu.EXE

、系统面板介绍



、功能说明

1,菜单---系统---隐藏到托盘
该功能主要作用:将软件最小化到托盘运行。

2,菜单---系统---退出
该功能主要作用:退出系统,点击后先执行清理线程和任务,然后退出。

3,菜单---系统设置数据类型
该功能主要作用:设置可识别数据的MIME类型。可以自定义修改。一般情况下无须改动。

4,菜单---系统设置输出目录
该功能主要作用:后期图片,网页快照或其它文件引擎须下载文件时预留功能。目前该功能暂时没有用到。

5,菜单---系统设置连接设置
该功能主要作用:设置蜘蛛线程、线程、工作时间、全局采集等相关参数。该面板的设置对蜘蛛有重大影响。

6,菜单---系统设置排除相关

  该功能主要作用:对于全网抓智能抓取时,可以除排相关后缀的域名。(如:.org:.gov 多个域名格式之间用分号隔开)。

7,菜单---系统设置风格皮肤

  该功能主要作用:美化软件,提供了七种不同风格的软件皮肤,可根据喜好自由设定。

8,快捷菜单---清空日志
该功能主要作用:清理采集时的错误日志,合理应用可以优化软件内存占用。

9,快捷菜单---系统设置

该功能主要作用:同菜单项系统设置。

10,快捷菜单---分类管理
该功能主要作用:数据源分类设置,默认分类:本地搜索、站内搜索、全网搜索。可根据应用行业自由设定。

11,快捷菜单---规则管理

  该功能主要作用:设置要抓取的数据源。支持多网址批时导入。

12,快捷菜单---多引擎合并

  该功能主要作用:当多个蜘蛛或机器同时工作时,最后可以将多个引索文件合并成打包成一个文件提供搜索使用。

13:指定引索保存目录
功能位置 ,该功能主要作用:根据需求将抓取引索文件存放指向本机任意合适磁盘位置。

14:定时任务
功能位置,该功能主要作用:自由周期性的设定采集任务。启用监控后到达您指定的时间,蜘蛛会重新对所有设定网站进行二次抓取。并自动跳转任务周期到下一个时间。

15:报告

功能位置,该功能主要作用:当用户采集所有网站时,该功能详细记录已引索的网站记录,在群采所有网址时可以设定从第几个开始引索。

16:规则管理批量网址导入

  该功能主要作用:可以批量导入多个网址,可以设网址预先写入本地txt文档, 网址格式采用(网易 http://www.163.com)。每一行网站名和网址用空格符分开,第二个网址另起一行。建议一次只导入1-3000个网址。

本文来源:https://www.2haoxitong.net/k/doc/8ad8ef17f18583d0496459f0.html

《蜘蛛功能说明.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式