详细信息
基于倒排索引的全文检索系统的研究
文献类型:会议论文
中文题名:基于倒排索引的全文检索系统的研究
作者:彭涛;孙连英;刘畅;鲍泓
第一作者:彭涛
机构:[1]北京联合大学信息学院软件工程系 北京 100101 北京联合大学信息服务工程北京市重点实验室 北京 100101;[2]北京联合大学信息服务工程北京市重点实验室 北京 100101;
第一机构:北京联合大学机器人学院软件工程系|北京联合大学北京市信息服务工程重点实验室|北京联合大学智慧城市学院软件工程系
会议论文集:中国计算机用户协会网络应用分会2011年第十五届网络新技术与应用年会论文集
会议日期:20111003
会议地点:北京
主办单位:中国计算机用户协会
语种:中文
中文关键词:全文检索系统;文本信息;倒排索引;信息检索库
摘要:简要介绍了全文检索的背景和作用,以及与使用数据库进行结构化数据查询的区别。采用Heritrix进行数据获取,进行相应的文本内容提取;而后基于文本内容构建倒排索引,采用Lucene进行索引的构造和全文检索,完成了全文检索系统的开发,并对检索效率进行了优化。
参考文献:
正在载入数据...