搜索引擎可以说是目前所有互联网应用技术含量最高 的一种,尽管其应用形式非常简单:用户输入查询词,搜索引擎返回搜索结果。但是要为以亿计数的互联网用户提供准确快速的搜索结果,里面包含了很多技术手段。总的来说,搜索引擎技术所希望达到的目标可以归纳为:更全、更快、更准。
所谓”更全“,是从其索引的网页数量而言的,目前任意一个商业搜索引擎索引网页的覆盖范围都只占了互联网页面的一部分,可以通过提高网络爬虫相关技术来达到此目标。
”更快“这个目标则贯穿于搜索引擎的大多数技术方向,比如索引相关技术、缓存等技术的提出都是直接为了达到此目的。而其他很多技术也间接为此服务,即使是健在式海量云存储平台 ,也是为了能够处理海量的数据,以达到对”更全“和”更快“这两个目标的响应和支持。
在这3个目标中,如何使得搜索结果”更准“是最为关键的目标。无论是排序技术也好,还是链接分析技术也好,抑或是用户研究等技术,最终都是为了使搜索结果更加准确,以此增强用户体验。对于一个搜索引擎来说,达到”更全“与”更快“可以使其不落后于同类产品,但是如果能够做到”更准“,则能够构建核心竞争力能力。