SEO教程提供SEO基础入门教程
微笑SEO优化教程网:关注本站让你的SEO不断进步!

站内优化的细节和方法(全)

您现在的位置:SEO教程 > SEO优化教程 > 时间:2018-08-09 10:00:35 > 作者:smiseo
所有网站都只有两类网页:通常进行网站分析的时候,往往会把站内网页分成首页、频道(子域名)首页、目录页、目录分页、专题页、聚合页、聚合页分页、内容页、内容页分页、以及索引页(导航页)等类型来进行专门的分析和设计改动建议。其实宏观来看,所有网站都只有两种类型的网页:内容页和聚合页。

站内优化的细节和方法(全)

内容页是具体的信息页,是网站的根本,也是用户真正需要的页面;而其他页面实际上都是通过对内容页的聚合,按照一定的规则把内容页中的部分内容和内容页的链接聚合到一个页面上,按照URL层级设计、页面内容及链接布局,分出了以上所提到的内容页之外的其他各类页面。或搜索聚合,或标签聚合,或格式化数据聚合,或属性聚合,或专题化聚合。在数据库中看,内容页会有很多属性和标签,这些属性和标签就为“聚合”提供了便利条件。分类目录页、TAG聚合页、专题页等都是根据内容的单一属性或标签进行的聚合;网站首页和频道首页是对内容进行了多属性和标签的聚合,只是为每个属性或标签单独设立了一个数据调用模块。在这些聚合中处处都透露着“站内搜索”的影子。

使用这种观点来看待网站,应该会把SEO工作简单化一些。传统分析网站会从首页到内容页进行顺序分析,其实完全可以从内容页到首页进行逆序分析,这样就简单地把整站网页划分成了内容页和聚合页两类,只是内容页之间、聚合页之间由于内容、主题的不同使用了不同的网页模板而己。

既然除了内容页之外都是聚合页,那么站内SEO相对就容易研究了。。比如在常见的页面类型中,研究除了内容页之外哪类页面是最容易获得搜索排名的,这类页面本身从URL设计、关键词定位、内容布局、对内容页的聚合方式、内链设计及外链获取上相对于其他类型的聚合页面有什么优势等问题。如果你可以明确地得到这些问题的答案,那么你就找到了一个小的SEO方向,至少可以把你发现的这种SEO优势运用到其他类型的聚合页面中去,而使其他类型的聚合页在搜索引擎中也得到一定的提升。

例如现在很多大中型网站都会制造一些TAG页面,以内容集合的形式获取更多的搜索流量。由,于关键词质量控制不严格,或网站本身内容不给力造成很多网站使用这种操作方法不成功,或收录不好,或排名不好,甚至有的还遭到了百度的严厉降权。按照以上思路TAG页是聚合页,网站的传统目录和专题页也是聚合页,只是模板不同而已,那为什么网站的目录页和专题页就可以获得良好的收录和排名,TAG页就如此不堪呢?此时就需要挖掘一下网站目录页和专题页的特点和优势,并把这种优势也融入到TAG页的设计中去。

比如目录页和专题页一般都有比较短的URL,甚至会直接放到主域名下;目录页和专题页一般都有比较丰富多样的内容,用户到达该页面后会有很多相关选择,跳出率会比较低;目录页和专题页一般会有丰富的内链甚至外链,内容页会通过面包屑自动为目录页添加链接,编辑也会在相关内容页中添加专题页的链接等。

反过来研究TAG页是否也拥有这些优势呢?如果没有,就可以从这几方面改进了。也可以为TAG页分配比较短且比较靠近主域的URL;可以通过对站内多种内容的不同形式的聚合来丰富TAG页的内容,甚至可以根据不同TAG词的词性做成不同模板的“专题页”;可以通过人工为内容打标签、。让技术配合使用中文分词和TF-IDF自动为内容打标签、直接为内容中的TAG词添加链接等方法来为TAG页增加内链。

关于外链,由于TAG词数量太多,所以不可能为每个TAG词都导入外链,但TAG词之间也肯定会通过站内搜索相关或语义相关,甚至按照数据库ID顺序平铺推荐的方式进行内部推荐,此时只需要按照一定的规则提取出部分有代表性的TAG词,如果结构上为这些TAG词导入外链可以惠及绝大部分TAG页面,那就为这些TAG词专门导入外链就可以了。这些工作中会涉及很多的细节设计、效果试验及质量评测,这里只是提供一个思路供大家参考。

前面提到这些类页面都没有严格的模板,站长把它们设计成什么样它们就是什么样。比如WordPress博客的首页就是内容列表页,如果后台配置每页只显示一篇文章,那么博客首页就是文章内容页。也没有哪儿规定网站列表页就是一列列内容页标题+链接的陈列,站长完全可以把列表页的首页设计成其他的模样,只要用户体验OK就可以了。当然为了使用户和Spider方便地浏览全站内容,目录或列表的分页还是可以保留通用样式的。以上只是举例说明所有类型的网页都没有死板的表现形式,完全可以任意使用用户能够接受的形式,并不表示以上改动一定会如何。关于聚合,大家可以多关注一下美丽说,能直观地看出这是一个由各种聚合页组成的网站,并且没有传统导航、没有面包屑,“聚合”中的页面质量、内链搭建和技术细节有很多可以研究的内容。

另外,“聚合”只是一种表现形式而已,SEO如果只关注关键词库及聚合本身就有些肤浅了。站在SEO的角度,要考虑到网站实际内容量和内容类型,以及关键词库的质量和词性分类等,站在网站运营和用户需求角度考虑的就是数据的二次萃取和挖掘了。网站内容繁多,把用户最需要、最有价值的内容挖掘出来,以什么样的形式呈现给用户,这才是需要更深入研究的。SEO不要只停留在关键词和内容简单聚合的表层,还需要尝试着深入研究一下自身网站用户的直接、横向和纵向需求,以尽可能符合用户需求、尽可能丰富的形式为用户提供一种有价值的“聚合”。

有不少SEO人员把SEO理论可解得很熟,但是一旦接触到拥有复杂网页类型的网站时就会迷惑,不知道如何下手。希望这个把网站内的页面抽象成内容页和聚合页两类网页的逆向思维观点,能够帮助一些基础SEO人员理清站内优化的思路。如果感觉这样表述不容易理解或更迷惑,那就直接跳过此节吧。

分享下途牛网SEO夜息的分享内容也涉及TF-IDF算法,在此简单介绍一下TF-IDF 。TF-IDF其实是TF*IDF,是一种用于数据挖掘和信息搜索的常用加权计算框架。TF为词频(Term Frequency),指的是指定字符在指定文档中出现的次数;IDF为逆文档频率(Inverse Document Frequency),是指定字符在整个文档集合中出现频率的一个相关数值,频率越大,IDF值越小;频率越小,IDF值越大。

对于指定关键词,在指定文档中,往往词频越大的关键词越能反映文档的主题;在指定文档集合中,往往关键词出现在越多文档中,就越不具有区分性和重要性,比如“我”“的”等。这样TF*IDF就可以比较客观地反映出指定文档的特征主题关键词了,指定文档集合中的指定文档中TF*IDF值越大的关键词越能代表该文档的主题,TF*IDF值越小的关键词越代表和该文档主题不相关。

另外,TF*IDF只是一个计算框架和模型,具体的计算方式会有很多,具体的就需要技术人员去搞定了。在经过大量试验确保效果良好后,SEO方面一般会提取单篇文档中TF*IDF值最大的3-5个关键词作为该文档的主题关键词,或为内容页智能打标签,或做内容之间的相关推荐等。关于TF-IDF更多的介绍和细节,大家可以多阅读一些网络资料或和技术人员进行深入的交流。

在此有必要提及的是,针对“聚合”类的网页,LEE在2013年9月6日发布了一篇《不相关静态搜索结果页将被严厉处理》的公告,公告核心内容如下:

百度网页搜索反作弊团队近期发现一部分网站遍历热门关健词生成大量的站内搜索结果页来获取搜索引擎流量,其中存在大量的不相关内容严重损害了搜索引擎的用户体验并且侵占了相应领域的优质网站收益,对于此类网站我们将做出严厉的处理,希望存在此问题的站长及时进行整改调整。
 
在LEE发布公告后,笔者与LEE有过几句简单的交流,LEE表示这次打击的都是明显垃圾的页面,一些垂直或行业网站的站内搜索页面其实质量很不错,并不在打击范围之内。利用词库做TAG聚合页或站内搜索页来抢夺搜索流量的现象已经存在很久了,百度官方也不止一次在不同场合声明这是明显的作弊行为,并且将会打击这种行为。但聚合页和站内搜索页本身的存在是没有问题的,也是顺应用户的需求而产生的,那为什么今天会有如此之多的网站所制作出来的聚合页或站内搜索页就沦落被百度搜索专门列为打击对象了呢?笔者简单总结了一下原因:
1.关键词本身规范问题:部分网站不区分关键词的类型,都直接导入站内,使用统一的模板生成页面。比如有些网站会硬性把“电磁炉”“电磁炉图片”“电磁炉品牌”等词导入站内生成统一的搜索页面,但是搜索页面中只有内容的标题和发布时间,只是简单搜索,并没有给用户呈现“图片”“品牌”的相关内容。当网站中这种杂词量级达到一定程度,宏观上看,整个类型的页面都是垃圾页,它只是为了骗取搜索流量,并没有为搜索用户提供相应的内容,严重降低了搜索结果的质量,这种行为影响比较大且必然会受到搜索引擎的专项打击。
2.关键词和网站之间的相关度问题:部分网站不分析关键词和网站之间的相关度,什么词都敢向站内导,比如手机网站可能导入一些房产、旅游关键词,旅游网站可能导入一堆美容、汽车或者工业关键词等,甚至有些正规内容网站导入了“买卖新娘”“济南人妖”等完全不搭边的关键词。网站本身的定位和这些关键词不搭边,网站内就更不可能有相关内容了,无论通过什么手段做出来的页面,质量都不会好到哪儿去。这类页面必然会被搜索引擎排斥和打击。
3.关键词数量和网站内容量平衡关系:部分网站所收集处理的关键词类型及关键词和网站内容相关性都比较好,但是没有事先检查网站的内容量是否足以支撑这些关键词。比如有的网站只有5W的内容,但是却导入了100万的关键词,即使关键词质量再好、关键词和网站主题再相关,用5W的内容去整合出100W的页面,那么这些页面如果不是空页面(搜不出内容),宏观来看就肯定有大量重复页面。从而导致整个类型的页面也都是垃圾页面,受到搜索引擎的打击。
4.站内搜索质量问题:有些网站可能把以上问题都解决了,在放出关键词之前也做了一步确定工作,确定用该关键词能搜出相关内容。但是网站站内搜索质量太差,导致所有聚合TAG或站内搜索页的内容和关键词本身很不相关,这并不是什么特殊的问题,大部分网站都会存在这个问题,“搜索”是一件很难的事儿,百度做了这么多年搜索,搜索结果还经常被大家吐槽,更何况其他非专业搜索公司做的“搜索”了。但是既然想用“搜索”做一些事儿,那就要保证最起码的搜索质量,不要搜索“会计培训”而给出一堆“小吃培训”"Java培训”之类的内容。大部分网站如果自己没
有比较强的技术团队,也没有第三方比较强的搜索技术支持,站内搜索结果的质量都不会很高,从而建立在低质站内搜索技术基础上的TAG和站内搜索页的质量也就不敢恭维了。由此做出的相关类型的页面也就可以被归到垃圾页面的行列中了。
                                                                                                                              
常见的垃圾聚合页和站内搜索页产生的原因基本是以上这4种之一,有些网站的确是用户搜索行为而产生了大量质量低下的搜索结果页,但网站没有做好审核,就把这些页面全部开放给了搜索引擎。其实这种被动原因和以上几个主动原因的结果都是一样的,在搜索引擎眼中并没有什么区别(在本书第12章中还会提到一些行业的推广人员专门利用有权重网站的站内搜索设置进行暴力推广)。在了解到常见原因后,如果SEO人员还是想利用聚合或站内搜索做一些事情,那么一定要在保证避免出现以上情况的前提下进行操作,否则可能会受到搜索引擎的处理,甚至导致整个网站受到惩罚 。
其实如果SEO人员真的能够从用户需求的角度来设计获取搜索流量的产品,根本就不会产生以上这类页面,这样的产品和网页是不可能获得任何一个负责任PM的支持的。之所以有很多网站会存在这类页面,是因为SEO人员充当了PM的角色,把SEO做得太“SEO”了,完全没有站在用户、资源、产品和运营的角度进行思考。

只做当下必要的工作:SEO有很多工作可以做,但是并不是所有对SEO有利的工作都是必需的。SEO其实是一个不断解决问题的工作,解决诸如内容不丰富、收录不好、内链设计、外链获取、排名不给力、搜索流量太低的问题等。一般是经过研究分析后,发现了切实的问题才会提出解决相应问题的建议和方案,所谓的“SEO方案”一般就是解决网站现有各种问题的建议文档,如果网站各方面都没问题,我认为这个SEO方案也不会有什么实质性的内容。

既然SEO是一个解决既有问题的工作,就代表在接手一个网站之后,并不需要把SEO涉及的方方面面都进行调整,并且根据“问题”的大小,还应该有解决问题的排序,而不是想起什么就做什么。比如大家都知道高配置的服务器和带宽可以提升网站的浏览速度和用户体验,同样也可以相应地提升网站流量,但这是建立在网站的服务器资源和带宽资源已经达到瓶颈的基础上的。为一个只有几十页内容和几个IP的企业站建议增加多么大的服务器和带宽资源是没有必要的,也不会有什么明显的SEO效果。再比如接手了一个拥有很老域名高权重的网站,网站已经积累获取了很多外链,但是网站的内容不足,不足以获取更多的搜索流量,那么此时SEO最应该做的工作就是研究与网站主题相关的关键词,并想办法为网站增加丰富专业的高质量内容,此时如果还建议加大在外链建设上的投入,那就走了岔路,根本看不到效果。

所以,大家在进行一项工作或做出某种决定之前,一定要根据网站的实际情况来分析网站当下到底需不需要这些方面的工作,如果不需要,那么一切都是事倍功半甚至是完全徒劳的。对网站SEO方面有利的工作太多了,但是具体到某个网站上,并不是所有工作都是必要和有用的,所以站长和SEO人员要综合分析,只做必要的工作,而不是在某些地方了解到某项工作对网站有利后就盲目去做。
 
最后来总结一下:站内优化是一项非常细致的工作,往往很多不起眼的细节综合影响了网站整体的SEO效果。比如专业词库、分词和站内检索系统的精度等基础功能的优劣,这些一般是站外人员分析不出来的,如果没有对大量用户的可用性测试,绝大多数站内人员可能也不会感觉出有什么差别。
但是搜索引擎是宏观分析网站整体页面和内容质量的,这些细微质量方面的差异可能使得网站在搜索引擎中的表现产生天壤之别。除了这些“看不见”的细节,本章中所提到的和没提到的很多看得见的细节,相信包括笔者在内的很多朋友都没有完全重视或优化到位。SEO需要从细节做起,不必追求面面俱到,先把自己所知道的基础性细节工作做好,再谈其他提升性质的工作。
关于站内优化,大概就到此处了,下一章咱来看看大家都疑惑的外链!

本文出自微笑SEO优化教程网,未经允许不得转载:站内优化的细节和方法(全) http://jc.smiseo.com/seoyhjc/282.html