复制内容网页
复制内容网页
复制内容网页指的是两个或多个网页内容相同,或非常相似。
一般来说,搜索引擎不喜欢复制内容网页,它们会尽量判断哪一个是原始版本,然后把其他的复制网页忽略不计。
有两点值得注意:
(1)复制网页的判断并不是依据一个简单的比例。假如说一个网页上有60%或80%的内容和其他网页相同,就被列为复制网页。如果真有这么一个比例那就简单多了,复制网页的判断要复杂得多。
(2)复制网页并不必然带来惩罚。搜索引擎会选出一个它认为的原始版本,不收录其他的复制网页版本杭州网站制作或者即使收录也在排名时忽略,但不会惩罚原始出处。
不过由搜索引擎判断哪个是原始出处,就有可能对真正原始出处产生类似惩罚的效果,比如搜索引擎判断错误,把原始出处当成复制的,而把复制的当成原始出处,复制或抄袭版本有排名,原始出处却找不到了。
复制内容网页的出现有这些可能原因:
(1)上面讨论的网址规范化问题所产生的。
(2)代理商和零售商网站经常从产品生产商的网站上抄下产品信息。这倒没什么不对,一般产品生产商也都同意,问题是绝大部分代理商、零售商、批发商都会直接复制而不做改动,所以这些电子商务网站上充斥着大量复制内容网页。
(3)打印版本。很多网站提供更适于打印的版本,如果没有用robots.txt文件禁止这些打印版本被收录,那么这些打印版本网页就可能造成复制网页。
(4)网页内容由RSS生成。有很多网站,尤其是新闻类网站,用其他网站的RSS种子来生成网站内容的,这些内容在原始出处和很多其他网站上都已经出现了。www.6998.net
(5)电子商务网站使用Session ID。搜索引擎蜘蛛在不同时间访问网页的时候出现不同的Session ID,但实际上网页内容是一样的。不过由于Session ID
发布站点:意大利网站建设,米兰做网站,意大利网站优化
本文地址:http://www.huaxia.it/seo/201309152760.html
- 上一篇:今天情人节我的站百度外链暴增
- 下一篇:今天是七夕,百度更新几家欢喜几家愁