3450399331
网站建设

成都网站制作公司剖析网站被镜像了如何解决?

发表日期:2025-03-01   作者来源:www.dohoc.com   浏览:201   标签:成都网站建设公司 成都网站建设公司分析网站被镜像了怎么办?    

镜像网站指的是和你的网站基本一样、并且实时同步的其它网站。就像照镜子一样,所以名为镜像。成都网站制作公司获悉,有些镜像网站是没恶意的,非常可能是你一个人设置的,为了便捷用户能从多个域名访问网站,被封了一个,还有其它的域名。譬如著名的草榴社区,仿佛就有不少镜像可以访问。

有些镜像,也就是这里讨论的镜像,是不怀好意的,一般是其他人设置的,要么为了负面网站优化你的网站,要么为了借助你的内容获得排名,然后把用户转向到敏锐、非法内容网站上去。

网上有些文章把采集和镜像混在一块。虽然表现形式差不多,但严格来讲,采集和镜像达成办法、表现形式是不同的。

采集的网站一般是提前抓取其他人网站的内容,放入自己数据库,再用程序调用到页面上。被采集网站有新内容时,采集网站并不可以实时同步更新,要再采集之后才能出现。一旦被采集,内容已经在他们数据库里了,从技术上是没办法阻止采集网站显示这类内容的。这篇帖子说的不是这种。

镜像网站并不事先抓取内容,而是有人访问网站时,实时从被镜像的网站调取内容,做些处置(替换URL、文字,加文字、加JS等),然后实时显示。被镜像的网站有任何更新,镜像网站是实时同步的。

小偷程序和镜像网站

网上有卖用于镜像网站的小偷程序的。小偷程序一般也可以用来做采集。为了不给他们做宣传,就不提名字了。从他们的官方网站摘取几条程序功能,能够帮助理解后面的内容:

全自动剖析,内外部链接接自动转换、图片地址、css、js,自动剖析CSS内的图片

内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等

伪原创,同义词替换有益于网站优化

增加URL路由,达成全站URL变换,个性化本站URL地址

超级模板增加移动模板、自概念栏目功能

增加自动获得301、302重定向的采集,解决跳WWW,跳https采集

代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自概念cookie,以便应付防采集手段

其实我是挺迷惑,网信办为何不责令关闭卖小偷程序的网站,这种网站才是真的该关的,而不是另外一些网站。

被镜像有哪些危险

从网站优化角度看,网站权重不高的小站、新站,被镜像意味着有其它网站和你的网站内容基本一样,搜索引擎大概觉得你的网站不是原版,镜像网站才是,所以把排名、流量给了镜像网站。

对有肯定历史、网站权重的网站,镜像网站取代原版网站的可能性微乎其微。但从心情角度考虑,被其他人镜像,内容被其他人偷走,即便没其它明显后果,也还是挺烦人的一件事。

另一个烦人的事是,镜像网站通常来讲并非要和你提供同样的商品或服务,而是把用户转到赌博、色情等服务上去。有些是通过JS把赌博、色情内容显示给用户,有些直接把用户转向到另外的网站上去。

如何发现自己网站被镜像了

有时注意到被镜像了是由于自己网站关键词排名降低,怀疑有人负面网站优化。有时是搜索品牌名字,看到镜像网站。已经了解自己被镜像了好办,直接看下面如何处置部分。

不少站长则完全不了解自己网站是不是被镜像了。有几个我常见的检查办法。

一是百度统计后台:

百度统计后台显示受访域名

受访域名部分列出了用相同百度统计代码的域名。其中出现网站快照、百度/Google Translate等是正常的,但出现一些奇奇怪怪的域名就要查询一下了,譬如上图里的第5、7、8个,访问一下就了解都是镜像网站优化天天一帖,引诱用户赌博的网站,然后站长把网站优化天天一帖的统计代码也照抄过去了。

看看上面列出的小偷出现功能就了解,其实统计代码比较容易替换或删除的。所以在受访域名只能看到一小部分镜像网站。

第二是搜索网站的特点句子。最易想到的是网站品牌名字、首页标题等,确实可以发现一些镜像网站。但如前所述,品牌名绝大部分是会被替换的,所以我更喜欢搜索一些页面上的特点句子,譬如本博客最上面的副标题:Zac的网站优化博客,坚持12年,优化成为生活。搜索一下就会看到:

搜索网站特点句子

看来我的博客比较容易吸引菠菜啊。

一般我不搜索帖子里的句子,由于那会返回很多转载、抄袭的页面,不是镜像的。

镜像网站替换字符串

上图镜像网站没转向,也没用JS显示很多菠菜内容,而是直接在正文中插入菠菜内容和链接。有些镜像网站用JS在页面上半部分显示很多内容,就像在典型赌博网站看到的一样,拉到下面才能看到镜像的内容。

为了搜得更全,还常常需要多搜索其它地方的特点文字。譬如搜索页脚的声明中的一句:“明明很长时间一贴,为何号称“看到另一些镜像网站:

搜索特点句子发现镜像网站

为何搜索句子的一半,不是搜索“明明很长时间一贴,为何号称网站优化天天一帖“呢?还是由于品牌词或特点关键字常常是会被替换的,譬如如此:

镜像网站替换关键字

一般我是用谷歌做这种搜索,由于谷歌什么一塌糊涂的都网站收录。

网站被镜像了如何解决?

第一,一些网上提到的解决方法并没什么用。

譬如有些说页面上的链接用绝对地址有帮助,其实小偷程序都会自动替换网址,用相对地址还是绝对地址没什么差别。

还有些说页面上加上网站链接、网站名字、版权声明之类的,搜索引擎会辨别什么是正版。但镜像小偷程序连链接带文字都可以全部自动替换,这么做并没用。

发现镜像网站后的处置原则就是让镜像网站不可以在镜像域名上显示你的内容。考虑到镜像网站是要实时访问和调用被镜像的页面的,所以可以考虑几个办法。

不过这种办法只对用户有效,搜索引擎不实行JS,还是会抓取到镜像内容。也可以用PHP写脚本判断和转向。

有时因为种种缘由,程序不起用途。另一个直接的办法是屏蔽镜像网站来访问的IP地址。先查一下镜像网站服务器IP:

查看镜像网站服务器IP地址

把他们主机IP先屏蔽了。不过镜像网站来实时抓取用的IP大多数状况下不是域名主机IP,可能是CDN,可能是伪造IP,也会是多IP的服务器。要发现需要屏蔽的IP,需要查询网站原始日志。我的一个小技巧是,访问镜像网站上一个极少人会访问的页面,譬如翻页第70页,然后立刻查询日志,这个页面被访问的IP就是应该屏蔽的IP:

从日志探寻需要屏蔽的IP

屏蔽了这个IP,再访问镜像网站就变成403错误了:

屏蔽IP后显示403错误

不了解页脚的友情链接是镜像网站自己加的?还是卖程序的人强制加的?

镜像网站常常是会伪造或实时轮换IP地址的,假如屏蔽一个IP网站还能访问,就再访问翻页69页、68页等等,找到更多IP。屏蔽也可以屏蔽IP段。我的经验是,一般镜像网站不会用超越10个IP地址。

另外,发现镜像网站,可以向百度、域名注册商、主机服务商投诉,需要关闭网站或删除页面。投诉是不是管用就是另一回事了,还是先做好IP屏蔽和URL测试。

如没特殊注明,文章均为优果网 原创,转载请注明来自http://www.huiguohuo.com/news/jianzhan/17506.html
上一篇:

下一篇: