最近发现我自己的Blog上每天都会有一两条垃圾Comment,内容都是色情或者赌博网站的广告链接。LonghornBlogs上也有人遇到了同样的烦恼。我的Blog用的系统是Movable Type,提供了blacklist功能作为anti-spam的手段,但感觉和早年的对抗Spam Mail的手段的思路差不多,都不太有效,即便已经有人总结出了一个很长的blacklist。现在我仍然是手工删除垃圾回复,我担心将来这样的垃圾回复会越来越多,删不胜删,在不久的将来变得和垃圾邮件一样让人头疼。
其实,一个简单有效的根治方法是用图像文字来鉴证真人与机器人。已经有人开始用了:

或许以后Email系统也应该这样做:发送者在点了"Send"按钮以后片刻,接受方服务器会送回一个带文字的图片要求输入所看到的文字,如果正确,邮件才能被成功送抵。
<<2004.11.2 增补>>
今天看到一篇非常不错的关于Blog Spam的文章:《Concerning Spam》。其中有些内容是专门针对Movable Type的,有些内容具有一定的普遍性。例如,它对spam做了分类:
- Basic comment spam
- Trackback spam
- Comment flooding
- Referral spam
- Send-mail spam
它也提到了利用Captcha来对付机器人:The benefit is that it screens out automated comment spam bots. The downside is that it keeps visually disabled people from contributing a comment. 我认为相对它提到的downside基本只是从理论上来说的,毕竟有视觉困难的人上网的太少太少了。
不过Captcha也只能用来对付比较愚钝的机器人。UC Berkeley早已有人研究如何破解Captcha多年了。