|
 |
[信息组织]搜索引擎的组成 |
Lee 发表于 2006/3/15 22:43:34 | 搜索引擎一般由Crawler、分析器、索引器、索引数据库、检索器和用户接口组成。Crawler以广度优先或深度优先的方法从Web上下载页面;分析器对下载页面的内容进行分析以用于索引,具体包括分词、过滤、转换等工作;索引器将文档表示为一种便于检索的方式并存储在索引数据库中,一般采用的方法有矢量空间模型、倒排文档、概率模型等;检索器实现用户查询关键词和目标文档匹配度的计算,根据计算结果所有符合查询要求的页面URL按照相关度递减的顺序排列,并返回给用户;用户接口为用户提供一个输入查询请求,定制查询结果的Web页面并将查询结果格式化后返回给浏览器。
|
|
| |
 | |
|
Blog 信 息 |
blog名称:风落沙 日志总数:348 评论数量:550 留言数量:52 访问次数:1603424 建立时间:2005年1月28日 |
|
友 情 连 接 |

|
|
|

| |
|