-
一月
24
再谈如何防止博客文章被抄袭
所有的原创blogger都对抄袭者深恶痛绝,yixiu甚至准备动用法律手段来解决了,但收效甚微,望月之前也曾简单的聊了聊避免抄袭的几个办法,拜读了几位仁兄的文章之后,有了更进一步的体会。想在这片文章中分享一下抄袭者的类别,跟踪抄袭的方法和防止被抄袭的方法。

Google和百度对待抄袭文章的区别
其实我一直以为,对待抄袭文章要有一颗平常的心,因为我一直使用Google搜索引擎,一般来说,就算有很多人抄袭我的文章,但通过搜索文章标题,我的文章在Google上排名都是第一的,因为Google有一套专门针对因抄袭而造成的重复内容的算法,一般是通过发布时间等各种要素来判断,虽然不是100%准确,但绝大多数都是原创内容有较高的排名,而百度的算法就无从得知了。比如我的一片文章:10个我退订你博客的原因,在Google上排名第一,而在百度上根本找不到我文章的影子,排在前面的都是抄袭者的内容,显然,百度在尊重博客原创方面比Google差得太远,难怪有那么多的抄袭者,难怪许多朋友说为什么Google和百度的收录情况差不多,但从百度来的流量几乎为零,包括我也有同样的情况。
谁抄袭了我
要对抗抄袭,首先要知道被那些人抄袭了,所以,先介绍几种检查被抄袭的方法。
搜索:这是最简单也是最为原始的办法,通过搜索你的博客文章标题或者是部分内容,可以清晰的看到那么是来自你博客的重复内容,然后逐一检查是否加了你的博客链接和名称。
反向链接:如果你在博客文章中加有自己的内部链接,那么,可以通过追踪反向链接的方式找到抄袭你文章的人,因为一般抄袭者都是比较懒惰的,不会逐一去检查你的链接。
copygator :磨剑庐介绍了一个比较有意思的抄袭检测工具copygator,说是可以通过检测feed输出从而判断出是否有人抄袭你,并通过Email、图片等方式反馈,不过貌似对中文支持不太好。如果有过人开发出一个这样的抄袭检测工具,相信一定会大受欢迎。
统计数据:经常查看你的统计数据,发现一些异常的数据,不妨进去看看,往往会有意外的收获。
他们为什么要抄袭
不懂或懒得添加原文链接:这种常见于一些blogger新手,他们并不知道还要给出原文链接,或者比较懒没有给出。
不知道原文出处:我曾遇到过这种情况,那哥们说转载的太多了,不知道那个是原文,所以没有给出链接,还有的给出的原文链接居然是抄袭我的人的链接。
恶意采集:有些站点和博客就是专门的垃圾采集站,没有原创,只有复制。
门户采集:许多所谓的门户网站有专门的“网站编辑”负责收集优秀的原创文章并据为己有,通常为去掉所有内链和特殊关键词。这种的危害最大,因为通常不会被发现并可以获得较高的权重。
一步一步防止抄袭
引用自己:也就是添加内链,适当的内链不但可以提高搜索引擎中的排名,而且可以追踪到抄袭者。
表明身份:比如将文章中的我改为“望月”,或者利用其它关键字表明自己的身份,让读者一眼就知道这是抄袭的。
提醒引用:可以在文末添加文章的引用地址或引用提示,当然,这是防君子不妨小人。
值得注意的是,一些文章中提高使用隐藏文字或者链接,使抄袭者在复制的时候自动加上版权信息,这个方法并不可取,因为他本身违反了Google的相关政策。上面说的这些都是防范措施,那么,当你检测到文章已经被抄袭了,该如何处理呢:
第一步,善意提醒。望月主张先礼后兵,先通过留言、Email等方式告诉站长或者博客主,你们抄袭我的文章了,请给予删除或给出原文链接,语气尽量友善。
第二步,严正警告。如果对方不予理睬或者言辞嚣张,那么可以发出最后通牒,警告如果再不采取补救措施的话将采取进一步行动。
第三步,采取行动。对付恶意抄袭切死不悔改的,那么就不需要留情面了,痛下杀手吧。
1.通知Google封他的站。Google的网站管理员工具中有一个“报告索引中存在的垃圾网站”项目,列出他的罪状,问题类型选择“重复的网站或网页”。
2.通知Google adsense,断其财路。通常做恶意采集站的都是为了盈利,如果他是使用的Google adsense,那么可以通过Google adsense的看法反馈,具体方法可以参考gseeker的文章。
3.通知空间商。一般来说,对于国外的空间商,只要你提供确凿的证据,表明网站是采集站的话,那么空间商会停止其空间运营,但国内的空间商一般都不会理会。
我觉得,良好的引用文章的方式应该是针对文章发表自己的看法,如果需要引用,最好是使用链接的方式,而不是全文复制。
你有什么好的防止抄袭的方法吗?不妨分享。
20 条评论于 “再谈如何防止博客文章被抄袭”
发表评论
Additional comments powered by BackType




