|
游客,本帖隐藏的内容需要积分高于 1 才可浏览,您当前积分为 0
资源信息:
中文名: 开发自己的搜索引擎:Lucene+Heritrix
作者: 邱哲
图书分类: 软件
资源格式: PDF
版本: 第2版
出版社: 人民邮电出版社
书号: 9787115215291
发行时间: 2010年01月01日
地区: 大陆
语言: 简体中文
概述:
内容介绍:
开发自己的搜索引擎:Lucene+Heritrix(第2版)》是一本介绍搜索引擎开发的书籍,通过《开发自己的搜索引擎:Lucene+Heritrix(第2版)》,读者可以独立构建一个企业级的搜索引擎网站。《开发自己的搜索引擎:Lucene+Heritrix(第2版)》讲解了搜索引擎与信息检索基础,Lucene入门实例,索引的建立,使用Lucene来搜索,排序,分析器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式,爬虫Heritrix,HTMLParser,DWR等内容。最后综合这些技术,构建了一个典型的垂直搜索系统,具有很强的商业实用价值。
《开发自己的搜索引擎:Lucene+Heritrix(第2版)》是一本使用Lucene和Heritrix来讲解搜索引擎构建的书,通过对API和源代码的分析,力求使读者在应用的基础上,能够深入其核心,自行扩展和开发相应组件,发挥想象力,开发出更具有创意的搜索引擎产品。
《开发自己的搜索引擎:Lucene+Heritrix(第2版)》适合Java程序员和从事计算机软件开发的编程人员阅读,同时也可以作为搜索引擎爱好者的入门书籍。
内容截图:
开发自己的搜索引擎:Lucene+Heritrix.pdf
目录:
第1章 搜索引擎与信息检索 1
1.1 搜索引擎的历史 1
1.1.1 萌芽:Archie、Gopher 1
1.1.2 起步:Robot(网络机器人)的出现与Spider(网络爬虫) 3
1.1.3 发展:Excite、Galaxy、Yahoo等 4
1.1.4 繁荣:Infoseek、AltaVista、Google和Baidu 6
1.2 信息检索系统的基本知识 9
1.2.1 信息检索系统 9
1.2.2 信息检索的过程 11
1.2.3 传统查找的优点和不足 12
1.2.4 使用索引提高检索速度 12
1.2.5 倒排索引 13
1.2.6 评价信息检索系统的标准 14
1.3 Lucene的简介 14
1.4 小结 15
|