六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 113|回复: 0

java使用正则表达式去除字符串的html标签

[复制链接]

升级  74.67%

46

主题

46

主题

46

主题

秀才

Rank: 2

积分
162
 楼主| 发表于 2013-2-7 20:49:20 | 显示全部楼层 |阅读模式
     新闻内容或者博客文章,如果显示摘要,需要去除内容的html格式标签,找到一个正则表达式,实现了:
   
/** * 删除input字符串中的html格式 *  * @param input * @param length * @return */public static String splitAndFilterString(String input, int length) {if (input == null || input.trim().equals("")) {return "";}// 去掉所有html元素,String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll("<[^>]*>", "");str = str.replaceAll("[(/>)<]", "");int len = str.length();if (len <= length) {return str;} else {str = str.substring(0, length);str += "......";}return str;} 
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表