通过中文字符比率来判断垃圾评论

最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。

要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。


 $len_all = strlen($comment['text']);                      
 $len_st = mb_strlen($comment['text'], 'UTF-8');
 if(($len_all-$len_st)/(2*$len_st) < 0.5){
        $error = "中文字符少于百分之五十";	
 }

如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。

图片水印插件 Watermark

折腾了好几天,终于基本完善了这个插件。实现了在为日志里的图片加上水印,支持文字水印和图片水印。插件只是在输出时过滤了图片链接,不对实际上传的图片进行任何修改。支持jpg、gif和png三种格式。有缓存功能,能缩小图片宽度。暂时还不支持SAE和BAE,先发出来再慢慢改。 下载

  • 插件目录下的lh.ttf为字体文件,如果需要添加自己的字体文件,需上传放在插件目录下,然后在插件设置里设定。
  • VM.png 为水印图标文件,可自行上传自己的图标文件,然后在插件设置中设定。
  • 插件激活时会在 usr 目录下创建 img 目录,如果创建不成功则无法使用缓存功能,如需清除缓存可以在本插件设置页面底部缓存设置那里有个链接,点击即可清除缓存文件。
  • 注意:1.2版已经去掉字体文件,需要自行下载喜欢的字体,上传到插件目录使用。

    阅读剩余部分...

    UploadPlugin 1.0.2 ( For typecho 0.9 )

    为了折腾Typecho的0.9,特意升级了原来的UploadPlugin ,能直接从后台上传或者删除插件和模板。首先需要服务器支持php的 ZipArchive 类,否则不能使用插件。再一个就是没有上传的进度条,在网络较差且上传文件较大的情况下要注意浏览器的状态栏,不一定是网页失去响应,等上传完毕就会有提示。下载

    截图1.jpg

    阅读剩余部分...