`
qqybh
  • 浏览: 66688 次
  • 性别: Icon_minigender_1
  • 来自: 太原
文章分类
社区版块
存档分类
最新评论

正则表达式对敏感词的操作

阅读更多
引用

public static String getSensitive(String globWords){
//从数据库中得到敏感字
AppContext appContext=AppContext.getInstance();//获得配置文件
ApplicationContext ac=appContext.getAppContext();
FfxxManager ffxxManager=(FfxxManager)ac.getBean("ffxxManager");
List<Ffxx> ffxxList = ffxxManager.getFfxxList("");
        StringBuffer regex = new StringBuffer();
        regex.append("(");
     
        for(int i = 0 ; i < ffxxList.size() ; i ++)
        {
         //如果敏感词中含有"("则进行替换,否则会抛出异常
        String ffxx = ffxxList.get(i).getFfxxToPage();
        if(ffxx!=null&&!ffxx.equals("")){
        ffxx = ffxx.replaceAll("\\(","[(]");  
        }
        regex.append("(");
        regex.append(ffxx);
        regex.append(")");
        if(i != ffxxList.size()-1){
          regex.append("|");
        }
        }
        regex.append(")");
        String keywords = regex.toString();
String sensitive = "";
Pattern pattern = Pattern.compile(keywords);  
      Matcher matcher = pattern.matcher(globWords);  
      if (matcher.find()) {  
                  //得到含有的敏感词
                  sensitive = matcher.group(1);
         System.out.println(matcher.group(1));
      }  

return sensitive;
}

分享到:
评论

相关推荐

    利用Python正则表达式过滤敏感词的方法

    以上这篇利用Python正则表达式过滤敏感词的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。 您可能感兴趣的文章:Python 实现王者荣耀中的敏感词过滤示例python 实现...

    php小经验:解析preg_match与preg_match_all 函数

    正则表达式在 PHP 中的应用在 PHP 应用中,正则表达式主要用于:•正则匹配:根据正则表达式匹配相应的内容•正则替换:根据正则表达式匹配内容并替换•正则分割:根据正则表达式分割字符串在 PHP 中有两类正则...

    详解C#正则表达式Regex常用匹配

    使用Regex类需要引用命名空间:using System.Text.RegularExpressions; 一、利用Regex类实现验证 ...// Console.WriteLine(字符串中包含有敏感词:孙权!); //} if (Regex.IsMatch(source, 孙权)) {  Console.WriteLin

    C#正则表达式Regex类的常用匹配

    使用Regex类需要引用命名空间:using System.Text.RegularExpressions; 利用Regex类实现验证 ...// Console.WriteLine(字符串中包含有敏感词:孙权!); //} if (Regex.IsMatch(source, 孙权)) {  Console.WriteLine

    基于多模态特征融合的即时社交软件违规图片检测系统(Python)通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词

    自动找出图片内含有的所有二维码并识别结果,通过正则表达式提取出二维码中所包含的域名,进行域名安全检测 对图片进行三分类,根据图片的内容,包括图片特征和文本信息对图片进行分类 支持建立图片黑白名单库,并...

    project-matt:马特计划

    正则表达式:当前,该应用程序检测到一些关键的欧洲个人数据正则表达式模式。 但是,您可以派生项目并添加更多正则表达式。 您可以在阅读更多关于可用分类器的。 关键字匹配:目前正在开发中。 尚未发布。 这是因为...

    JS敏感词过滤代码

    过滤敏感、不良词汇。本文主要讲述两种方式过滤敏感词汇。 我在这里直接以函数的形式体现出来,也就是说,用的时候直接调用函数即可。 方式一、RegExp() function filter() { ... // 正则表达式 // \d

    解析PHP留言本模块主要功能的函数说明(代码可实现)

    一,敏感词处理1,过滤敏感词preg_match()函数用来在字符串中搜索所有与给定的正则表达式匹配的内容,如果存在则返回True,否则返回False。语法:int preg_match(string pattern,string subject[,array matches[,int...

    KMP算法与trie搜索树实现

    KMP算法与trie树算法实现,以前觉得很不好理解,现在学习了正则表达式、NFA、DFA相关理论,并做了一些实践后,发现好理解多了。 shoulea 16:50 2011-5-20

    python爬取各类文档方法归类汇总

    下面简要记录一些个人已知的基于python3的抓取方法,以备查阅。...之后利用正则表达式等方式进行敏感词检索。 ### Reading TXT doc ### from urllib.request import urlopen from urllib.error import URLErro

    ZFJObsLib主要是通过Python写的混淆工具.zip

    常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用...

    网站架构技术

    正则表达式 trie树 双数组trie树 多级Hash表 信息降噪 分类算法_内容识别 黑名单 电子商务风险控制 风险 账户风险 买家风险 卖家风险 交易风险 风控 人工 自动 ...

    史上最好传智播客就业班.net培训教程60G 不下会后悔

    常用数据结构(List、Dictionary、Array)、多态、常用设计模式、反射、常用.net类库、泛型、IO流、委托事件、正则表达式、XML、反射、GC等。 2、数据库开发及ADO.Net(6天) 核心技术课程 数据库开发基础、...

Global site tag (gtag.js) - Google Analytics