搜索与排名

Author: 影子 46 views

通过爬行,抓取,索引后,进入了最关键的一步——排名。当用户在搜索框输入关键词搜索后,排名程序调用索引数据库里的数据。然后通过核心的因素或者说排名的关键信息,然后将排名显示给用户。

下面我们说一下搜索引擎是如何处理“搜索词”的?

无论是中文还是英文,当搜索引擎收到用户输入的搜索词后,需要对搜索词做一些处理,才能进入排名过程。

搜索词处理包括:分词、指令处理、拼写错误、热门/相关词、下拉词。

分词:分词指的是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多。

指令处理:指令处理就是在对用户输入的关键词之间使用“与”逻辑。比如用户搜索”SEO优化教程“,程序会将这个词拆分为”SEO“、”优化“、”教程“三个词。只有当三个词都匹配时,才会被认为符合用户搜索条件,才会被显示出来。但是在实际情况中,有可能只包含两个词就会被显示。这里还涉及一个高级搜索指令,如双引号,减号等。搜索引擎都会做出相应的判断和处理。

拼写错误:当用户输入了明显错误的字或英文单词错误时,搜索引擎会提示用户正确的用字或拼法。或者显示与错误的词最相关的内容。比如我搜索我另一个网站:集知盒子,但是我打成即知盒子,系统就会提示。

热门/相关词:当你搜索某些热门话题或者流量明星时,系统就会根据相关的人名或者关键词触发相关的内容。

下拉词:这个很好理解,就是在搜索框内输入某个词时,系统会根据搜索词相关且搜索量大的推荐搜索。

每个搜索引擎都有不同的网页排名算法。比如Google 有 200 多个排名因素。没有人知道所有的排名因素,但是关键因素却是公开的。如下图:获取完整版请关注公众号:增长艺术 回复1获取

排名因素

以下是Google排名最重要的一部分。

  • 外链
  • 相关性
  • 新鲜度
  • 话题权威性
  • 页面速度
  • 移动友好

Leave a Comment