根据搜索引擎判断原创的指纹算法我们知道搜索引擎可以把网页里面正文信息,提取一定的信息,可以是关键字、词、句子或者段落及其在网页里面的权重等形成一个信息指纹或特定一个特征,通过这个特征来区分不同的两篇文档,然而这个只是搜索引擎非常程序化的一个判断,这就不可避免会导致了搜索结果会出现很多的失误,因为对于两篇文档的关联判断不只决定于正文信息,还取决于信息背后的语义关联。而这一点搜索引擎一直在努力中,现在谷歌的整句搜索和百度的知心搜索都是语义搜索,就是对信息背后语义关联的挖掘,这可以让用户的搜索结果更加智能化,提供更加符合用户需求的搜索结果。
“iphone5多少钱?”
“苹果价格会不会降?”
很显然,如果是我们看,这2个句子肯定是有关联的,虽然这两个句子之间没有任何公共词语。虽然第二句中的“苹果”可能是指吃的苹果,但是由于第一句里面有了“iphone5”,我们会很自然的把“苹果”理解为手机产品,而仅仅靠传统的指纹算法是不会有这个效果的。人可以通过上下文语境很简单的来判断2句话的语义,那么搜索引擎是如何进行语义分析,判断它们之间的关联呢?这就要说到语义主题。
语义主题是什么?
语义主题就是文字中隐含的主题,上面的例子“苹果”这个词的背后既包含是苹果公司这样一个主题,也包括了水果的主题。当我们和第一句进行比较时,苹果公司这个主题就和“iphone”所代表的主题匹配上了,因而我们才会认为它们是相关联的。
主题就是一个概念、一个方面,它表现为一系列相关的词语,一个主题包含了若干个出现概率较高的词语。这些词语和这个主题有很强的相关性,这些词语共同定义了这个主题。对于一段话来说,有些词语可以出自这个主题,有些可能来自那个主题,比如一个文章如果涉及到“百度”这个主题,那么“中文搜索”、“baidu”、“搜索引擎”等词语就会以较高的频率出现,而如果涉及到“谷歌”这个主题,那么“英文搜索”、“google”、“搜索引擎”等就会出现的很频繁。而搜索引擎这个词同时都存在于百度和谷歌这2个主题。
搜索引擎对于文档的语义关联判断是相对的,在对2个文档对比时会对文档信息进行概括性分析,若2个文档对应的主题相当,那肯定是比较有关联的。语义关联判断是需要对比的,比如你搜索“苹果”搜索引擎就无法判断你要的水果还是手机,只会根据大部分人的一个搜索需求给出结果,单一一个包含于多个主题的词搜索引擎无法判断你需要的主题,只有根据你的长期搜索习惯来判定,所以需要加一个修饰,搜索“苹果手机”、“苹果和三星哪个好”,这样搜索引擎就能准确给出你需要的主题。
搜索引擎收录页面之后,发现一些关键词出现在一起的次数很多,可以形成一个共同的话题,从而把这些词归纳为语义相关的词。当这些语义相关性的词出现在一起形成一个话题的时候,对页面的核心关键词的相关性起到增强的作用,排名也会得到提升。
很空洞?举个例子,如果你搜索“选举”,搜索引擎可能会获取包含“投票”,“竞选”和“选票”的文本信息,但是“选举”这个词有可能出现很少或根本没有出现在这些信息来源中,也就是说语义搜索可以对关键词的相关词和类似词进行解读,从而扩大搜索内容信息与用户搜索词的准确性和相关性,提高核心关键词的排名,这比单一一个词带来的相关性要强的多。比如你要写一篇关于苹果手机的文章,如果在文章里全部加入苹果这个词,效果肯定不如再适当插入iphone、手机、乔布斯等词的效果好。
同时从SEO关键词角度来说,还可以扩大网页标题与内容的相关性,内容中加入和标题关键词主题关联度高的词可以让标题和网页内容的相关性得到加强。所以在写文章的时候除了适当插入核心关键词之外还可以加入与这个主题相关或相似的词来使结果与用户搜索词更相关。
综上所述,语义主题关联判断是一个能够挖掘语言背后隐含信息的利器,同时我们也可以根据搜索引擎的语义关联判断来服务于网站的优化和推广。不要排斥搜索引擎,努力的接近它,认识它,了解它,我们才可以更好的利用它,搜索引擎的规则就在那里,利用不利用就看你的认识有多深。
文章来自 木木SEO
文章出自: http://www.tzxnews.com/?p=857 您可以复制链接 郑重声明:本站文章部分为作者原创文章,可自由引用,但务必请以链接形式标明本站或本文地址!