丁宇 | DING Yu

LT 0.5.1:更短的URL和开放的人肉SPAM资料库

抽空把LonelyThinker升级到了0.5.1,主要有以下两方面改动:

更短的URL

LT原来文章页面的URL很长,都是类似“/posts/view/:slug”这样的格式,再加上前面的“http://dingyu.me/blog”,没加slug时URL已经有33个字了,我索性把它改为了“/:slug”,这样短很多。

比较烦的就是CakePHP 1.2中不支持像Rails那样的named routes,一旦要修改路径就很麻烦。当然这也不能怪Cake,毕竟这是Ruby作为动态语言的优势。

开放的人肉SPAM资料库

LT 0.5的一个重点功能,就是名为“M-O”的评论过滤机器人,借助M-O的贝叶斯算法,我的blog目前已经拦截了17700多条垃圾评论!我现在根本不需要操心此类SPAM。

LT帮我拦截的SPAM

问题是,国内劳动力成本太低了,很多人花时间跑过来一条条贴垃圾评论,这种垃圾评论很难用某种数学算法去识别和屏蔽-至少不在我已知的范围内。我现在的策略只能是来一条删一条,顺便把Email和网站关键字甚至IP加入到黑名单里。就这样,黑名单里积累了不少SPAM资料。于是我干脆把这些资料公开出来,如果有人愿意,可以以此作为自己网站的屏蔽关键字列表。

这个人肉SPAM资料库的地址是:http://dingyu.me/blog/api/blacklist.json,欢迎转发。

另外,谁知道怎么把CakePHP中find("all")出来的结果中的模型名去掉?比如这个资料库中的“Blacklist”。

 

最近几个月迷上了Rails,对PHP的感情变淡中 :)


  1. 超级考拉 @ 2010-11-10 05:46:18 +0800:

    你可以使用disqus评论系统,我就在使用它,非常的好。

  2. 丁宇 @ 2010-11-24 21:56:59 +0800:

    @超级考拉 我看了你blog上的演示,我这里因为速度的缘故,体验不是太好,中间textarea要等很久才能载入。