搜索引擎工作流程:搜索引擎的工作流程大致上可以分为四个步骤 。
爬行和抓取
搜索引擎派出一个能够在网上发现新网页并抓取文件的程序 , 这个程序通常被称为蜘蛛() 。搜索引擎蜘蛛从数据库中已知的网页开始出发 , 就像正常用户的浏览器一样访问这些网页并抓取文件 。并且搜索引擎蜘蛛会跟踪网页上的链接 , 访问更多网页 , 这个过程就叫爬行 。
当通过链接发现有新的网址时 , 蜘蛛将把新网址记录入数据库等待抓取 。跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本方法 。搜索引擎蜘蛛抓取的页面文件与用户浏览器得到的完全一样 , 抓取的文件存入数据库 。
文章插图
蜘蛛爬行和抓取
建立索引
【如何让自己网站排名提高(快速提升网站排名的】搜索引擎索引程序把蜘蛛抓取的网页文件分解、分析 , 并以巨大表格的形式存入数据库 , 这个过程就是索引 。在索引数据库中 , 网页文字内容 , 关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录 。
搜索引擎索引数据库存储巨量数据 , 主流搜索引擎通常都存有几十亿级别的网页 。相关阅读:外贸网站建设优化的技巧你知道吗
搜索词处理
用户在搜索引擎界面输入关键词 , 单击“搜索”按钮后 , 搜索引擎程序即对输入的搜索词进行处理 , 如中文特有的分词处理、对关键词词序的分别、去除停止词、判断是否需要启动整合搜索、判断是否有拼写错误或错别字等情况 。搜索词的处理必须十分快速 。
排序
对搜索词进行处理后 , 搜索引擎排序程序开始工作 , 从索引数据库中找出所有包含搜索词的网页 , 并且根据排名计算法计算出哪些网页应该排在前面 , 然后按一定格式返回“搜索”页面 。
排序过程虽然在一两秒之内就完成返回用户所要的搜索结果 , 实际上这是一个非常复杂的过程 。排名算法需要实时从索引数据库中找出所有相关页面 , 实时计算相关性 , 加入过滤算法 , 其复杂程度是外人无法想象的 。搜索引擎是当今规模最大、最复杂的计算系统之一 。
文章插图
搜索引擎排序
如何提高外贸网站排名
在搜索引擎上做推广 , 首先要制作一个高质量的网站 。从搜索引擎的标准看:一个高质量的网站包括硬件环境、软件环境、搜索引擎规范性、内容质量 。
搜索引擎的蜘蛛识别到一个网站时会主动抓取网站的网页 , 抓取过程中 , 蜘蛛不仅抓取网站的内容 , 还会抓取一系列的技术性指标 , 比如内链结构、爬取速度、服务器响应速度等 。蜘蛛抓取网页后 , 会由数据清洗系统做网页数据的清洗 , 在这个过程中搜索引擎会对数据的质量、原创性做出判断 , 筛选出优质的内容并且收集到大量网页技术性指标 。
搜索引擎对优质内容作分词处理后进行相关度计算 , 然后将在抓取过程中获得的网站技术性指标、网页技术性指标作为排序的重要指标(俗称网站权重、网页权重) , 同时搜索引擎会考虑网页的链接关系(包括内链和外链)作为排名的依据 , 不过目前外链关系的重要性正逐年递减 。同时谷歌等搜索引擎还会收集用户访问行为去调整搜索引擎结果排序 , 比如某个网站访问速度经常很慢 , 它就会降低这个网站的权重;如果某个网页的点击通过率(100个人搜索某个关键词 , 点击某条链接的比率)一直很低 , 也会被降低权重 , 这些都会导致网站排名下降 , 反之则会提升网站排名 。
- 霜降怎样养生 霜降如何养生
- 秦朝变法功臣商鞅的死是自己一手造成的
- 解析:金庸小说笔下的金轮法王的人生如何悲剧?
- win10如何管理员 win10怎样电脑管理员-
- 张国权个人资料和图片张国权如何
- 佟童个人资料和图片佟童如何
- 刘国梁个人资料和图片刘国梁如何
- 演员潘虹个人资料和图片演员潘虹如何
- 董洁的儿子图片个人资料和图片董洁如何
- 枇杷酒怎么酿 枇杷酒如何制作