搜索引擎的具体底层工作原理很复杂,但我们抽象概括后,搜索引擎的工作原理包括三个过程:
方法/步骤
1
1、抓取网页。首先在互联网中发现、搜集网页信息;每个独立的搜索引擎都有自己的网页抓取程序(spider),俗称蜘蛛,英文名字spinder,因为引擎程序在网页上查找页面的过程,就像蜘蛛再织一张网的运动一样,所以搜索引擎程序又被形像的称为蜘蛛。
2
2、处理网页。其次对信息进行提取和组织建立索引库。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
3
3、提供检索服务。再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
注意事项
1
本经验为本人在实践工作中,所学习总结,如有表述不够准确与贴切之处,欢迎指证与评价,谢谢!
2
如果你觉得此经验对你有一定用处与帮助,请帮我点击投下“成功”的一票和“收藏”一下,如果觉得有哪里写的不好,也欢迎指证和评价,谢谢!
上一篇:怎么投诉物业
下一篇:房地产销售入职培训有哪些内容?