去除字符串中的HTML元素
  R0Sx2erBMixA 2023年11月02日 56 0


package com.gwideal.jxwfkjlweb.util;

import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 去除字符串中的HTML元素
 * @author zhou_chaofei
 *
 */
public class TxtWithoutHTMLElement {

	 public static String getTxtWithoutHTMLElement (String element)
     {
        
         if(null==element||"".equals(element.trim()))
         {
             return element;
         }

         Pattern pattern=Pattern.compile("<[^<|^>]*>");
         Matcher matcher=pattern.matcher(element);
         StringBuffer txt=new StringBuffer();
         while(matcher.find())
         {
             String group=matcher.group();
             if(group.matches("<[\\s]*>"))
             {
                 matcher.appendReplacement(txt,group);    
             }
             else
             {
                 matcher.appendReplacement(txt,"");
             }
         }
         matcher.appendTail(txt);
         repaceEntities(txt,"&","&");
         repaceEntities(txt,"<","<");        
         repaceEntities(txt,">",">");
         repaceEntities(txt,""","\"");
         repaceEntities(txt," ","");        
         return txt.toString();
     }
	 private static void repaceEntities ( StringBuffer txt,String entity,String replace)
     {
         int pos=-1;
         while(-1!=(pos=txt.indexOf(entity)))
         {
             txt.replace(pos,pos+entity.length(),replace);
         }
     }

	public static void main(String[] args) {
	   System.out.println(getTxtWithoutHTMLElement("<a href='a/test'>test</a>"));
	   System.out.println(getTxtWithoutHTMLElement("<a href='a/test'>test</a>"));

	
	}
}

 

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  kG7ef0NqClb6   2023年11月13日   35   0   0 java
  u2N3sQ7nC0dn   2023年11月13日   35   0   0 java
  rCd1NYtlhh0U   2023年11月13日   35   0   0 java
  rCd1NYtlhh0U   2023年11月13日   38   0   0 java
  bSubxmxwEKmm   2023年11月13日   35   0   0 java
R0Sx2erBMixA