高校就业信息平台的垂直搜索引擎实现作者:徐勇 薛建芳来源:《中小企业管理与科技·下旬刊》2013年第03期
摘要:利用开源软件Lucene工具包实现一个基于垂直搜索的高校就业信息平台,为大学生就业提供专业对口、内容全面、权威准确的就业信息,大力促进高校毕业生的就业。
关键词:Lucene 垂直搜索 就业
1 概述
近年来,随着高校扩招规模的逐年加大,毕业生数目也随之水涨船高,各大城市招聘市场的火爆场面更是让众多的毕业生望而生畏。通过网络平台发布就业/招聘信息越来越受到大学生和企业双方的重视。本文采用开源工具包Lucene实现了一个基于B/S模式的高校就业信息平台,为大学生提供专业对口、信息准确、实时高效、可以设定就业地域/薪酬水平等等的垂直搜索服务。
2 高校就业信息平台的总体框架
本系统包括以下模块:
2.1 信息采集模块 本模块采用网络蜘蛛自动采集网页信息,获取与招聘信息有关的网页,并对这些网页进行存储,之后运用信息抽取技术,提取出网页的结构化信息,如招聘企业的地址、工作类别、工资待遇、相关要求等,并将这些数据存入数据库当中,为用户提供查询和检索信息。
2.2 数据库管理模块 本平台主要包括两个数据库。网页采集数据库:用于存储网络蜘蛛已经采集到的网页信息,已经发现但是还没有遍历的新URL列表,网页权值的存储以及索引和数据字典信息存储等等。信息数据库:用于存储所有招工单位的基本信息。包括企业名称、地址、电话、招工岗位、薪酬、和其他具体要求等等。
2.3 信息检索显示模块 此模块是用户和该平台的一个信息交互窗口,给用户提供最终的查询结果,同时还提供了供用户选择的查询方式。用户可以根据自己的需要选择查询方式和显示方式,最终在此模块中对用户展现结果。
3 系统实现
本文来源:https://www.2haoxitong.net/k/doc/4d2552d30640be1e650e52ea551810a6f524c8a4.html
文档为doc格式