引用
public static String getSensitive(String globWords){
//从数据库中得到敏感字
AppContext appContext=AppContext.getInstance();//获得配置文件
ApplicationContext ac=appContext.getAppContext();
FfxxManager ffxxManager=(FfxxManager)ac.getBean("ffxxManager");
List<Ffxx> ffxxList = ffxxManager.getFfxxList("");
StringBuffer regex = new StringBuffer();
regex.append("(");
for(int i = 0 ; i < ffxxList.size() ; i ++)
{
//如果敏感词中含有"("则进行替换,否则会抛出异常
String ffxx = ffxxList.get(i).getFfxxToPage();
if(ffxx!=null&&!ffxx.equals("")){
ffxx = ffxx.replaceAll("\\(","[(]");
}
regex.append("(");
regex.append(ffxx);
regex.append(")");
if(i != ffxxList.size()-1){
regex.append("|");
}
}
regex.append(")");
String keywords = regex.toString();
String sensitive = "";
Pattern pattern = Pattern.compile(keywords);
Matcher matcher = pattern.matcher(globWords);
if (matcher.find()) {
//得到含有的敏感词
sensitive = matcher.group(1);
System.out.println(matcher.group(1));
}
return sensitive;
}
分享到:
相关推荐
以上这篇利用Python正则表达式过滤敏感词的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。 您可能感兴趣的文章:Python 实现王者荣耀中的敏感词过滤示例python 实现...
正则表达式在 PHP 中的应用在 PHP 应用中,正则表达式主要用于:•正则匹配:根据正则表达式匹配相应的内容•正则替换:根据正则表达式匹配内容并替换•正则分割:根据正则表达式分割字符串在 PHP 中有两类正则...
使用Regex类需要引用命名空间:using System.Text.RegularExpressions; 一、利用Regex类实现验证 ...// Console.WriteLine(字符串中包含有敏感词:孙权!); //} if (Regex.IsMatch(source, 孙权)) { Console.WriteLin
使用Regex类需要引用命名空间:using System.Text.RegularExpressions; 利用Regex类实现验证 ...// Console.WriteLine(字符串中包含有敏感词:孙权!); //} if (Regex.IsMatch(source, 孙权)) { Console.WriteLine
自动找出图片内含有的所有二维码并识别结果,通过正则表达式提取出二维码中所包含的域名,进行域名安全检测 对图片进行三分类,根据图片的内容,包括图片特征和文本信息对图片进行分类 支持建立图片黑白名单库,并...
正则表达式:当前,该应用程序检测到一些关键的欧洲个人数据正则表达式模式。 但是,您可以派生项目并添加更多正则表达式。 您可以在阅读更多关于可用分类器的。 关键字匹配:目前正在开发中。 尚未发布。 这是因为...
过滤敏感、不良词汇。本文主要讲述两种方式过滤敏感词汇。 我在这里直接以函数的形式体现出来,也就是说,用的时候直接调用函数即可。 方式一、RegExp() function filter() { ... // 正则表达式 // \d
一,敏感词处理1,过滤敏感词preg_match()函数用来在字符串中搜索所有与给定的正则表达式匹配的内容,如果存在则返回True,否则返回False。语法:int preg_match(string pattern,string subject[,array matches[,int...
KMP算法与trie树算法实现,以前觉得很不好理解,现在学习了正则表达式、NFA、DFA相关理论,并做了一些实践后,发现好理解多了。 shoulea 16:50 2011-5-20
下面简要记录一些个人已知的基于python3的抓取方法,以备查阅。...之后利用正则表达式等方式进行敏感词检索。 ### Reading TXT doc ### from urllib.request import urlopen from urllib.error import URLErro
常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...
正则表达式 trie树 双数组trie树 多级Hash表 信息降噪 分类算法_内容识别 黑名单 电子商务风险控制 风险 账户风险 买家风险 卖家风险 交易风险 风控 人工 自动 ...
常用数据结构(List、Dictionary、Array)、多态、常用设计模式、反射、常用.net类库、泛型、IO流、委托事件、正则表达式、XML、反射、GC等。 2、数据库开发及ADO.Net(6天) 核心技术课程 数据库开发基础、...