前几天有网友提议,是否可以开发一个WordPress兼容较好的敏感词过滤屏蔽插件。毕竟很多时候,不论你是有意还是无意的时候,可能网站中有某一个或者某一些关键字属于敏感词。一来可能导致被谈话,二来可能影响网站在搜索引擎的权重,三来可能网站还可能被网络屏蔽。如果让我们自己手动找和替换肯定比较麻烦,即便替换后也不能确保以后没有这个关键字的出现。
我们可以使用插件工具自动检索和过滤这些可能的敏感关键字。当然,市面上也有很多类似的插件和方法,有的甚至接入的百度文本审核API。在第一个版本的时候,老蒋没有考虑到接入百度文本审核,一来是需要付费,二来第三方可以得到常规的屏蔽关键字导入到本地库基本上可以起到屏蔽作用,三来毕竟也有整改期限,如果有被找可以再去定期添加关键字屏蔽库中。这不,经过张罗,这款 LeFilter 敏感关键字屏蔽插件初始版本上线。

插件的常规设置,我们可以根据需要开启与否。过滤范围可以根据需要勾选文章、页面、评论留言中有可能出现的敏感词。对于过滤动作,我采用的是直接清空,或者自定义替换关键字。当然,在后面我们也会看到,如果你采用的是指定替换关键字的话,就以指定替换优先。
我们也可以根据需要,设定不同用户的过滤。在这个过滤机制中,实际的内容是没有变化的,而是在前端显示的时候被替换,毕竟如果数据库完全替换,那可能会导致有一些真实需要的内容,只是分词的时候导致的误判敏感词被替换,这样也不好。
我们也可以开启日志,看到哪些页面中有词被替换,然后可以手动的去针对修改。毕竟每次的访问过滤,会增加数据库的负担。如果我们针对有出现的过滤日志,去手动更新内容,那会不断的完善内容。

根据需要自定义导入关键字。也可以根据需要指定替换关键字,如果你不指定,就会以前面基础设置的指定过滤动作。也可以根据现有的词库删除,这里我们也有采用防止重复的机制,如果你有添加过,会过滤掉不会重复添加。

中华文化博大精深,有些时候分词误判,导致实际语句的意思错误。这里我们也可以设置某些关键字的白名单。

在这个插件的命中日志和统计中,可以看到文章、页面和评论的被替换的数量,然后根据实际需要去修改和替换。便于帮助我们去快速的定位需要修改的文章和段落。
如果你还有其他的更新需求,也可以提出来。
未经允许不得转载:老蒋玩开发 » LeFilter 自定义敏感词自动过滤屏蔽插件

微信关注,获取新知 







