搜索引擎对于页面相关性的计算

来源:六安网站优化 发布时间:2021/3/23 10:02:46 浏览量:679次

  选出初始子集后,对子集中的网页页面测算关键字关联性。测算关联性是综合排名过程中最重要的一步。关联性测算是搜索引擎计算方法中最令六安网站优化有兴趣的部分。干扰关联性的主要原因包含以下几方面。
  1.关键字较常用的程度。通过分词后的数个关键字,对整体搜索字符串的实际意义贡献并不相同。越较常用的词对搜索词的实际意义贡献越小,越不较常用的词对搜索词的实际意义贡献越大。举个例子,假定使用者输入的搜索词是“增肥方法”。“增肥”这个词较常用的程度非常高,在很多网页页面上会出现,它对“增肥方法”这个搜索词的辨识的程度和实际意义相关度贡献就很小。找出那些包含“增肥”这个词的网页页面,对搜索排名关联性几乎没有什么干扰,有太多网页页面包含“增肥”这个词。常用词的极致就是停止词,对网页页面实际意义完完全全没有干扰。
  因此搜索引擎对搜索词串中的关键字并不是同等对待地处置,反而是依据较常用的程度开展加权。不较常用的词加权系数高,常用词加权系数低,排名算法对不较常用的词给予更多的观注。
  2.词频及密度。一般认为在没有关键字堆积的情况下,搜索词在网页页面中出现的次数越多,密度越高,说明网页页面与搜索词越有关。当然这只是一个大致直观规律,实际情况要复杂得多,出现频率及密度只是综合排名原因的很小一部分。
  3.关键字位置及形式。如同在索引部分中提到的,网页页面关键字出现的格式和位置都被记录在索引库中。关键字出现在比较重要的位置,如标题标签、黑体、H1等,说明网页页面与关键字越有关。这一部分就是网页页面SEO所要处置的。
  4.关键字距离。切分后的关键字完整配对地出现,说明与搜索词最有关。比如说搜索“减肥方法”时,网页页面上持续完整出现“减肥方法”四个字是最有关的。假如“减肥”和“方法”两个词没有持续配对出现,出现的距离近一点,也被搜索引擎认为关联性略微大一点。
  5.链接分析及网页页面权重。六安网站优化小编告诉大家除了网页页面本身的原因,网页页面之间的链接和权重关系也干扰关键字的关联性,在其中最重要的是锚文字。网页页面有越多以搜索词为锚文字的导入链接,说明网页页面的关联性越强。

  • 木易信息工程科技有限公司

    版权所有

  • 24小时全国服务热线:4008-551-662

    总部地址:安徽省合肥市蜀山区森林橙堡B栋17楼

    总部客服电话:0551-65333448