六安网站优化之去停止词与消除噪声

来源:六安网站优化 发布时间:2021/7/22 9:46:15 浏览量:226次

  六安网站优化小编要告诉站长们的是无论在英语还是汉语中,都会有一些出现频率高但对内容没有影响的词,如助词“di”、“di”、“de”,感叹词“ah”、“ha”、“ah”,副词或介词“li”、“yi”、“jie”。这些词被称为停止词,因为它们不会影响页面的主要意思。英语中常见的停止词有the, a, an, to, of等。
  搜索引擎在索引页面前删除这些停止词,使索引数据主题更加突出,减少不必要的计算。
  让我们谈谈减少噪音的问题。在大多数页面上,还有其他部分的内容并不会对页面的主题做出贡献,比如版权声明文本、导航栏、广告等。以常见的博客导航为例,几乎每个博客页面都会出现文章分类、历史存档等导航内容,但这些页面本身和“分类”、“历史”这些词是没有关联的。一个用户搜索“历史”或“类别”,然后返回一篇博客文章,仅仅因为这些词出现在页面上是毫无意义的,完全不相干的。
  所以这些块是噪音,只能作为分散注意力的六安网站优化网页页面主题。搜索引擎需要识别并消除这种噪声,在排名时不要使用噪声内容。消除噪声的基本方法是根据HTML标签对页面进行阻塞,区分页眉、导航、正文、页脚、广告等区域。网站上大量重复的块往往属于噪音。去除页面的噪声后,剩下的就是页面的主体部分。

  • 木易信息工程科技有限公司

    版权所有

  • 24小时全国服务热线:4008-551-662

    总部地址:安徽省合肥市蜀山区森林橙堡B栋17楼

    总部客服电话:0551-65333448