搜索引擎设计需要解决哪些问题

    搜索引擎性能搜索引擎性能的评价指标有以下几个:响应时间响应时间,是指用户发出搜索指令到得到搜索引擎结果页面之间所用时间(时延)。对于成熟的搜索引擎而言,很多时候,这个时延可能低于0.0几秒。Google搜索可以直接看到这个时间。
 

      查询吞吐量查询吞吐量,是指在定时间内搜索引擎系统能够处理的查询数量。比如,秒内可以承受100万个用户搜索数据。       索引速度索引速度,是指搜索引擎将已经收录的文档编排索引,从而提高搜索的速度。当用户搜索个词时,搜索引擎可以直接利用这些索引,以便更快地给出搜索结果。       搜索引擎合并新数据的速度搜索引擎几乎是时刻都需要将新数据合并到当前的索引中,这个过程有两点需要注意: 覆盖率覆盖率,是指衡量现存信息有多少被索引和存储在搜索引擎中。       搜索引擎对于互联网上的某些页面不予收录,对于另外些页面可能只收录,却不加入索引。时效性时效性,又称"新近性"和"时新性",是指搜索引擎库中存放的页面的时间或年龄。       百度搜索引擎在熊掌号中提到过优质内容维度之是时效性,时效性的是新的新闻,几天内可以得到很高的排名和曝光,但热度下去之后,可能排名和曝光会差很多了。

本文地址: 搜索引擎设计需要解决哪些问题:/news/case/4070.html