SEO教程提供SEO基础入门教程
微笑SEO优化教程网:关注本站让你的SEO不断进步!

百万流量:详说原创内容和SEO关系

您现在的位置:SEO教程 > SEO优化教程 > 时间:2018-11-05 20:37:14 > 作者:smiseo
原创内容和SEO:有不少站长和SEO人员在以自己网站存在多少比例的原创内容,或者全站都是原创内容来标榜自己网站的价值。当一个网站被搜索引擎降权或者被K时,往往站长和SEO抱怨比较多的也是“为什么我原创那么多,还是被K呢?”这里就来简单讨论一下搜索引擎、原创内容和SEO之间的各种问题。
什么是原创内容:百度百科中对原创的解释是这样的:
(1)作者首创,非抄袭模仿的、内容和形式都具有独特个性的物质或精神成果。
(2)作者自己创作的、具有社会共识价值的文学、艺术或科学性质的作品。
(3)特指自己写的、非抄袭或转载的博文。
并注释:第三条本不恰当,但已是网络上约定俗成的规则,应予认可。
那么站长和SEO人员口中的“原创”应该就是第三条所描述的情况了,只要是自己写的,不是抄别人的内容就是自己的原创。并未像一二条中那样要求有“独特个性的物质或精神成果”或有“社会共识价值”,也就是说“原创”的内容并不等同于“有价值”的内容。
原创不等同干有价值:站长和SEO人员所说的大部分“原创”只是阐明文章是自己人写的、并非抄袭别人的,那么文章的内容质量如何就不得而知了。极端的说,在擦拭键盘的时候,打在文档中的内容也可以算是原创的,然而这个“原创”对普通大众用户并没有实际意义,更没有阅读价值。
百万流量:详说原创内容和SEO关系
比如一个定位于房地产信息的网站,却发布了很多和肾病有关的“原创”文章,那么这些“原创”在这个站上就是没有意义的。同样,即使所有的原创文章都没有偏离网站主题,但是文章没有实际信息传递给用户,只是行业文字堆砌而已,那么这个“原创”也不是有价值的。
所以原创并不等同于有价值,虽然搜索引擎并不能直接分析出网站上的原创文章是否对网民有价值,但是百度搜索可以根据网站权重、历史内容表现、跳出率,社会化分享数据,甚至百度工具栏返回的网民数据来辅助判断网站的内容价值。在运营网站的过程中,站长和SEO人员并不应该标榜自己有多少原创,而应该标榜自己网站上的内容是否对目标用户都有意义。在标榜自己原创的很多网站中,其实有不少内容都是围绕事先设定的关键词拼凑出来的,可读性并不是特别好。
不少网站原创内容并不是很多,但是用户体验非常好,网站固定用户量非常大,即使内容并非原创但是依然会在搜索引擎中获得比较好的排名和流量;也有不少网站站内原创内容比例非常大,但是内容质量参差不齐,或服务器反映比较慢,或内容页面添加了大量的广告严重影响了用户对正常内容的阅读,或网站存在其他问题,而导致坚持原创内容很久都不能够在搜索引擎中得到良好的排名和流量。
网站所有内容都是站在目标用户需求的角度上进行的原创,这最好不过了。但就目前国内的网络发展状况来看,任何一家网站做到所有的内容都是原创且都对用户有价值是不太可能的。其实网站运营也并不需要完全都是原创,运营网站和做长远的SEO对内容的要求,都应该是以对用户有价值为主,原创为辅。
搜索引擎能否判断原创:很多站长和SEO人员都反映百度不支持原创网站,自己原创的内容被大站复制走后,排名都是大站的了,自己的站甚至都不被收录,更别提排名了。不讨论现在百度和各大搜索引擎具体是怎么识别原创的,先按照咱们属丝的思路简单推断一下如果搜索引擎想要识别原创应该会怎么做。
部分人都认为用文章发布时间是最直接的了,谁发布的早谁就是原创。这个道理是正确的,但是对于搜索引擎要判断某一篇文章谁是原创,是比较困难的,因为网站发布内容的时间存在太多不确定因素。
如果以网站上标注的发布时间戳为准,那么就会诱使网站去主动改变自己网站上显示的文章发布时间。比如内容源网站标注发布的时间是2018年11月5日17点35分,那么采集网站完全可以根据源网站的时间把发布显示的时间改成2018年11月5日17点30分,这样采集网站就是原创了。所以理论上以网站标注的时间戳为准是可以解决原创判断问题的,但是前提是所有的站长都遵守规矩,这显然是不可能的,并且偶尔可能会出现服务器时间有偏差,而造成网站上标注的文章发布时间并不准确。
如果以Spider发现这篇文章的时间戳为准,那么小网站被大网站采集后,肯定会被搜索引擎认为这篇文章是大网站原创的。因为根据网站权重不同,搜索引擎抓取网站的频率就不同。·比如搜索引擎的Spider可能会24小时都在新浪首页等着新内容的出现然后秒收,但是可能一天内只光顾个人的小网站一两次。当一篇原创文章在小网站上发布后,被新浪的编辑选中然后推荐到新浪首页,搜索引擎肯定会先从新浪上发现这篇文章,那么就会认为这篇文章是新浪原创的。所以在现实情况下,以Spider发现内容的时间戳为准也是不能识别原创的。这并不能怪搜索引擎不分配资源实时抓取网络新内容,相信搜索引擎的老大哥Google都不能实现对网络新内容的实时抓取。
第三种假设,如果以来源网站作为对原创的判断,理论上和以网站的文章发布时间为时间戳判断是一样的。只是理论上可以做到判断原创,问题是现实中大部分网站转载或复制文章后都不留来源地址。大部分自动采集程序都是在想办法去掉来源地址。站长不配合,搜索引擎在这个方法上就玩不下去。
通过这样简单分析,按照普通思路搜索引擎其实是不能严格识别出原创的。现在国内搜索引擎一般都是以谁能够提供好的用户体验,具有更好的传播影响力为排名基础。因为大网站确实有更稳定的服务器支持,更佳的用户体验,所以现在在百度中的状况是大网站采集了小网站的内容,搜索排名却比小网站要好。网络上所传的参考PR、权威度、网站域名注册时间等信息基本上都不是判断原创的标准,只是判断网站权重的标准,如果真的以这几项来判断原创,那边小网站的原创内容就更永无天日了。LEE曾在百度站长平台的站长学院发布过一篇《谈谈原创项目那点事》的文章,有兴趣的朋友可以仔细阅读一下,了解一下当下百度是打算如何识别原创内容的:https://ziyuan.baidu.com/college/articleinfo?id=31
不可否认Google在这方面的表现要比百度、搜狗都强很多。但是在Google上的这种“公平”现象也是建立在原创文章的网站本身有一定权重的基础上的。比如极端一点,一个还在沙盒中的新网站,文章全部是原创,但是并不一定会被收录,即使被收录,因为整站都在沙盒中也不会有排名。从而采集网站本身不用太高的权重,只要不在沙盒之中,相关文章标题和关键词的搜索排名肯定是采集网站的。所以Google对原创的识别判断也是有其他条件的,并不是所有网站的原创内容都能得到Google的尊重。
百度会如何对待原创内容:百度现在对原创的支持程度是远远不够的,至少同Google相比还差的很远。在百度搜索一
下“原创网站被K”百度收录的相关信息就有77万之多。可以看出在站长和SEO人员眼中,原创内容和小型原创网站在百度网页搜索中的待遇了。原创并不一定会获得好排名好流量,反而高权重非原创很大程度上会获得好排名好流量,百度新闻搜索在2018年下半年升级算法之后更是如此。
从上文中,可以知道任何搜索引擎包括谷歌在内都不能真正识别原创,只能看该搜索引擎在尊重原创上投入多大精力,来使得采集的内容普遍超过原创内容排名的情况慢慢减少。
微笑在最初写此文章时,在百度的搜索结果中,百度对自己平台上的原创内容都没做
到“搜索时排在首位”。((百度Spider不支持Crawl-delay设置的通知))一文肯定为百度站长平台原创和首发,然后得到了其他站长网站和论坛的转载。但是同样的标题、同样的内容,原创、首发且拥有百度自身先天高权重的百度站长平台却屈居在了第五的位置。由此可以想象百度搜索在面对小网站小博客的内容被大网站转载采集后的相关关键词排名结果。除了不是原创,前面的四个网页肯定在其他方面有地方超过了百度站长平台本身,也就是说“原创”在百度搜索排名算法中起到的作用还是有限的。
因为站长和SEO考虑问题都只是考虑一方面,在研究某一个因素对排名的作用时,也是假设相对比的两个页面或两个网站的其他因素都完全一模一样,然而这种情况是不存在的。如果百度搜索结果真的达到站长和SEO人员设想的原创一定排名最好的状态,那么搜索引擎一直标榜自己有几百个的排名算法就都可以申请倒闭了。只要其他那几百个算法还在起作用,就不可能达到站长和SEO理想的状态。
即使百度搜索真的会向尊重原创方面做出很大的努力,理想状态也只是搜索原创文章自己开辟先河的全文标题的时候,原创文章被排在搜索结果比较靠前的位置,不可能搜索文章所定位的全部关键词时,该文章都无条件的有比较好的排名。否则百度搜索只是尊重了原创,放弃了其他排名因素,会造成搜索结果质量的大幅度下滑。和同一关键词相关的原创内容、其他各种形式的网页都太多了,所谓尊重原创最好的体现形式也就是,用户在搜索原创文章独有的特征关键词时,原创文章会排在转载文章的前面;或者在所有内容相同的网页中,被判断为原创的那一个会被优先展示。不过百度也会综合考虑排名网站其他方面的条件,如果原创网站其他方面太弱,甚至网站经常打不开,相信再原创也不会有好的排名。因此,站长和SEO人员在短时间内最好不要对百度搜索抱有“原创排名就好”的幻想。因为百度也一直在提倡“原创”,所以“原创”文章对文章本身排名和整个网站的权重都会有一定积极的作用,但是也只是诸多排名算法中的一个而已。
百度搜索在2013年启动了“原创星火计划”以试图解决原创识别问题。据介绍,百度第一期识别原创的算法在2013年4月份之前已经上线,但是也只解决了百分之几的问题,百度方面表示希望可以在一两年内彻底解决原创内容判断的问题。在2013年5月初发现搜索部分新闻时,在百度搜索结果中出现了被标识为原创的网页。百度搜索“绿城中国调整债务结构”时,发现自然排名第一,财经网的新闻,在搜索结果标题下有了“财经网的原创文章一作者:【财经网专稿】记者王熙喜一发表时间:2013年05月07日”的标注,这应该就是百度官方所提到的识别原创的项目,不过暂时看来适用范围还是很有限。
期望原创内容和原创网站能够尽快得到百度搜索全面合理的支持,至少不要让中小型原创网站只为大型网站做嫁衣,而获得不到应有的支持。百度的原创星火计划暂时来看也只适合媒体资讯类网站,不适合对全网的原创内容进行实施,并且能够有资格进入这个星火计划的网站也肯定是有一定影响力的网站,很多地方小型媒体网站都不一定有资格加入,暂时还看不到解决小站原创问题的希望。
在2013年5月20日百度第二次高端SEO俱乐部的会议上,有人提出了“小网站写了原创,大网站转载,Spider去小网站不频繁,百度会先收录大网站,之后收录小网站,百度怎样去判断原创。”的问题。百度搜索LEE团队给出的回答是“我们之后希望中小网站能够通过ping机制ping给百度,这样就可以从时间上进行初步区分。大网站有用户等权重积累,用户也倾向于点击大网站的链接,我们希望通过适当引导改变这种现状。”表示以后中小网站可以通过ping机制来告诉百度自己是该篇文章的第一发布者,以辅助百度识别原创。这其实就是上文讨论过按照一定时间戳来判断原创的思路,可能ping机制实施后,“原创”问题能够得到一定的改善,但是还不能从根本上解决问题。并不是所有的中小站长都懂得如何为网站配置ping功能,如果中小站长没有配置好ping功能,大型网站又把该功能利用的很好,最终还是会导致中小网站被大站采集之后,文章被当成是大站原创的情况。
原创是值得尊敬的,相信被百度搜索K掉的原创网站,并不全是原创低质的网站,也有不少原创高质的网站。众多网站在靠着百度存活和发展,虽然百度一直在努力,并且承诺会尽快解决这个问题,但是在百度没有明显做出相关算法改进之前,或即使已经比较尊重了原创内容,但还是没有达到站长和SEO人员的理想状态,那站长和SEO人员应该何去何从呢? 附上第二次百度高端SEO俱乐部会议总结地址:https://ziyuan.baidu.com/wiki/178。
SEO和站长应该怎么做:微笑想阐述即使原创被搜索引擎当做重要排名算法,那也是几百个算法中的一个,并不能因为原创就获得最好的排名。那站长和SEO把“原创”当成和关键词布局、内链布局、外链建设、网站结构优化等可以有助于收录和排名的可操作因素一样就好了。
对于百度搜索现在的排名规则,一味的询问“我的文章是原创,为什么排名不好,或者被K了?”和询问“我的网站内链是独创,为什么别人模仿了我的,收录和排名比我好,反而我的站被K了?”一样。相信大家都会觉得第二个问题比较可笑,其实原创和内链一样,都只是判断一个网站综合质量的因素,并不能独自成为完全决定一个网站收录和排名的因素。
站长和SEO在面对“原创”和外链、内链时要把心态调正,在做原创内容的同时也要优化好网站的其他指标:有个稳定的服务器、有良好的站内导航、有丰富逻辑性的内链布局、有大量高质外链等。所以站长和SEO与其纠结于“原创为什么被K,为什么收录和排名不好”,倒不如把网站的整体优化好。网站整体优化好之后,也就不存在上述问题了。大家所发现的复制自己内容且网站收录和排名很好的网站,肯定这些站其他方面要比自己做得好,比如网站权重高、相应的文章页面获得的内链和外链多等。
万事靠自己,别把百度搜索神化。把自己所有希望的状态都奢望让百度去实现,无异于农民只期望老天爷给自己一个好收成,结果可能只是一次一次的失望。百度的搜索部门也是由一个一个普通的技术和运营人员组成的,技术实力的确很强,但是整个百度搜索系统也肯定存在可以改进的空间。
有一些朋友反映自己的原创网站被采集后,自己的站被K了,感觉不公平。其实网站和网站之间本来就是平等的,有排名就会有排名高低。同样是个人博客,同样是原创,为什么有的朋友个人博客原创内容被采集后就被百度K了,Zac老师的博客文章不多,也是个人博客,被采集转载的次数肯定比一般的个人博客要多一些,为什么没有被K呢?网站性质都一样,为什么在百度上会有两个极端的现象呢?可能有人会说ZAC老师博客的权重高外链多,那大家为什么不向这方面努力发展呢?而是只纠结在“原创”上呢?
在尊重原创方面百度搜索确实应该再多做一些工作,但是站长和SEO也应该多思考一下,很多资源都是需要自己去争取的。和Zac老师博客一样,把自己做强了,不一定要做大,总会得到属于自己的“公平”。做SEO被K被降权不重要,重要的是坚持下去,继续创作有价值的内容。运营网站SEO最初的姿态是想尽办法从百度获得流量,最终的目标应该是让百度想尽办法收录你的内容给你流量。
另外,运营网站不能完全只是从原创出发,要从“对用户有用”的角度出发。现在己经是信息爆炸的时代,除了过于偏门的行业,几乎任何问题和信息网络上都已经存在了。只是对于某些情况来说,零散的信息并不能很好地解决问题。比如“领带的打法”,常见的方法可能就有十多种,并且有的人寻找文字说明、有的人寻找图片示意、有的人寻找教学视频,这些信息可能分散在各个网站上,你只需要把这些信息有机揉合在一起做成符合用户搜索需求的信息页或者专题页。这就是“对用户有用”的,虽然不是原创,但相信百度和其他搜索引擎也是欢迎这种网页的。
也有人把这种形式称作“伪原创”,不过笔者并不认同这种叫法。正规运营网站,没有“伪原创”的概念,只要是对用户有用的,并且不是简单票J窃其他人的内容,就是值得做的。如果网站内容更新时就是以“伪原创”为主导,那网站内容的可读性和价值都是值得怀疑的,因为出发点就把自己定义为“作弊”了。当然也可以利用这个理论和搜索引擎机器判断之间的区别寻找作弊空间,这也是现在部分SEO人员的工作了—研究搜索引擎想达到的理想状态和当下实际机器识别技术之间的差别。
如果自己网站的内容被一个各方面都不如自己的站采集后,却抢得了比自己还好的排名,并且这个网站没有其他作弊行为,一直持续着这种状态,那么搜索引擎就该关门大吉了,因为它们已经判断不出哪个网站和哪些内容的综合质量最优秀了,也就不能提供给普通用户最优质的信息了。把“原创”和关键词布局、外链、内链以及网站结构一样对待,就只当成是所有排名因素中的一个,当成是站长和SEO人员可操纵的一项SEO因素。综合了解到自己和对手相比之下的不足后,就去努力想办法优化和超越吧,这不是SEO人员的正常工作之一吗?
另外,在站长平台一章中也提过,现在百度原创星火计划已经开始公开接受站长申请,原创且有一定影响力的网站可以尝试申请二下,具体介绍专题地址为:https://ziyuan.baidu.com/college/courseinfo?id=746&page=1,通过本方内容优化的小伙伴们应该清楚明白原创内容是什么了。
 
本文出自微笑SEO优化教程网,未经允许不得转载:百万流量:详说原创内容和SEO关系 http://jc.smiseo.com/seoyhjc/323.html