搜索引擎是一组用于搜索特定领域内的信息并将该信息整理到数据库中的程序。人们经常使用这个术语来指代互联网搜索引擎,这些引擎是专门为搜索互联网而设计的,但它们也可以被设计用于离线内容,例如图书馆目录、个人硬盘驱动器的内容或博物馆目录收藏。这些程序帮助人们以易于访问的方式组织和显示信息。
搜索引擎包含三个方面:爬行、索引和搜索。当爬网时,它会查找上次爬网期间不存在的新内容,包括文件和网页的更新。然后,程序对信息进行索引,提取特定的关键字对其进行分类。例如,在互联网上,索引在很大程度上依赖于网页中的关键字和提供有关页面信息的元标记。
一旦信息被索引,有关如何访问它的信息就会存储在数据库中。一些程序还存储或"缓存"信息,以便更容易检索。当有人搜索数据库时,它会输出按相关性排名的结果。例如,在wiseGEEK上,搜索"长颈鹿"将出现与长颈鹿相关的文章,当然包括"什么是长颈鹿?"
虽然所有搜索引擎都以类似的方式工作,但它们的用处却截然不同。它们严重依赖于复杂的算法对搜索结果的相关性进行排名,尤其是常见关键词的搜索结果。用户往往会被那些返回他们喜欢的结果的网站所吸引,Google®、Yahoo!® 和 Bing® 等互联网网站都在争夺具有各种功能的用户,这些功能旨在使他们的搜索更有吸引力、更相关。
<图>搜索引擎使人们能够找到相关的搜索结果。Google® 已成功地与进行网络搜索的过程紧密相连,该过程通常通俗地称为"谷歌搜索。"该公司实际上对此不太满意,因为它担心小写字母的使用以及通用名称的使用可能会导致商标稀释。
许多互联网搜索引擎都足够聪明,可以向用户学习,结合用户交流活动纳入其相关性排名。他们还依赖其他页面的链接和网站声誉等信息来对搜索结果进行排名,所有这些都在一个部分的一小部分内。熟练的用户有时可以操纵搜索结果,但许多程序都会发生变化和发展,以帮助打击这种做法。
0 篇文章
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!