搜索


会员资源切换至【手机版】

切换本帖至【手机版】


开启左侧

开发自己的搜索引擎:Lucene+Heritrix第2版[PDF]

[复制链接]
发表于 2021-8-22 23:10:39 | 显示全部楼层 |阅读模式

游客,本帖隐藏的内容需要积分高于 1 才可浏览,您当前积分为 0


资源信息:



中文名


: 开发自己的搜索引擎:Lucene+Heritrix


作者


: 邱哲


图书分类


: 软件


资源格式


: PDF


版本


: 第2版


出版社


: 人民邮电出版社


书号


: 9787115215291


发行时间


: 2010年01月01日


地区


: 大陆


语言


: 简体中文


概述


:




内容介绍:


开发自己的搜索引擎:Lucene+Heritrix(第2版)》是一本介绍搜索引擎开发的书籍,通过《开发自己的搜索引擎:Lucene+Heritrix(第2版)》,读者可以独立构建一个企业级的搜索引擎网站。《开发自己的搜索引擎:Lucene+Heritrix(第2版)》讲解了搜索引擎与信息检索基础,Lucene入门实例,索引的建立,使用Lucene来搜索,排序,分析器,对Word、Excel和PDF格式文档的解析,Compass搜索引擎框架,Lucene分布式,爬虫Heritrix,HTMLParser,DWR等内容。最后综合这些技术,构建了一个典型的垂直搜索系统,具有很强的商业实用价值。   《开发自己的搜索引擎:Lucene+Heritrix(第2版)》是一本使用Lucene和Heritrix来讲解搜索引擎构建的书,通过对API和源代码的分析,力求使读者在应用的基础上,能够深入其核心,自行扩展和开发相应组件,发挥想象力,开发出更具有创意的搜索引擎产品。   《开发自己的搜索引擎:Lucene+Heritrix(第2版)》适合Java程序员和从事计算机软件开发的编程人员阅读,同时也可以作为搜索引擎爱好者的入门书籍。


内容截图:




开发自己的搜索引擎:Lucene+Heritrix.pdf


目录


: 第1章 搜索引擎与信息检索 1 1.1 搜索引擎的历史 1 1.1.1 萌芽:Archie、Gopher 1 1.1.2 起步:Robot(网络机器人)的出现与Spider(网络爬虫) 3 1.1.3 发展:Excite、Galaxy、Yahoo等 4 1.1.4 繁荣:Infoseek、AltaVista、Google和Baidu 6 1.2 信息检索系统的基本知识 9 1.2.1 信息检索系统 9 1.2.2 信息检索的过程 11 1.2.3 传统查找的优点和不足 12 1.2.4 使用索引提高检索速度 12 1.2.5 倒排索引 13 1.2.6 评价信息检索系统的标准 14 1.3 Lucene的简介 14 1.4 小结 15

主题推广




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

切换至【手机版】| 主站| Archiver|

JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!

|网站地图

GMT+8, 2026-6-22 22:57 , Processed in 1.362952 second(s), 121 queries .

 

快速回复 返回顶部 返回列表