以文本方式查看主题

-  W3CHINA.ORG讨论区 - 语义网·描述逻辑·本体·RDF·OWL  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  新书推荐!清华出版社新书《搜索引擎零距离》  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=75262)


--  作者:rayeen2009
--  发布时间:6/6/2009 7:59:00 PM

--  新书推荐!清华出版社新书《搜索引擎零距离》
新书推荐!清华出版社新书《搜索引擎零距离》

购买地址:
http://www.china-pub.com/195494

本书作者主页: http://www.rayeen.com


【内容简介】
随着网络信息资源的急剧增长,人们越来越多地关注如何快速有效地从海量的网络信息中,抽取出潜在的、有价值的信息,使之有效地在管理和决策中发挥作用。搜索引擎技术解决了用户检索网络信息的困难,目前搜索引擎技术正成为计算机科学界和信息产业界争相研究、开发的对象。.

本书的作者是一位资深的搜索引擎开发人员,书中对数据获取(网络信息挖掘)与数据检索(搜索引擎)两个方面作了深入的介绍。本书首先提出了一套“ 网络数据挖掘”的完整理论,并给出一个实际的智能爬虫系统,通过理论与实际的完整呈现,使读者能够对“网络数据挖掘”有一个比较具体的认识,然后介绍了一个专用程序语言IRS,并给出了这个语言的编译器以及虚拟机的实现方法。本书还通过对多个开源搜索引擎项目抽丝剥茧的细致分析,引出搜索引擎的一些基本原理与开发方法,并介绍了一个商业化搜索引擎的实例。本书的最后还结合一个Java框架介绍了一些软件设计思想。..

本书涉及网络数据挖掘、搜索引擎原理、编译原理、数据库原理、正则表达式、软件工程、设计模式、Ruby语言、HTTP协议等计算机科学与技术的知识,适合搜索引擎开发人员作为参考,也适合有一定计算机基础的读者阅读,以扩展视野。

本书的内容中,既有教科书式的理论阐述,也有“七天入门”式的实例解析,还有《Linux内核情景分析》风格的细致的代码分析,甚至还有一些英语文献翻译,从初学者到有一定经验的搜索引擎开发人员,各个层次的读者都能找到一些适合自己阅读的章节。


本书特色:
l 国内垂直搜索引擎的扛鼎之作
l 集开源搜索引擎之大成,融会贯通,自成一体
l 无线搜索引擎核心技术零距离接触
l Web信息挖掘专用程序设计语言,语法标准首次发布
l 垂直爬虫专用并行虚拟机核心技术展示
l 多年商业搜索引擎开发运营经验之提炼总结
l 真实的中型分布式搜索引擎开发案例全景展现
l 最新Java前沿技术在经典计算机理论上的优秀应用
l 专业信息检索理论与商业搜索需求的完美结合
l Java软件工程设计模式最佳实践


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
9,313.477ms