六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 114|回复: 0

java 去html标签,去除字符串中的空格,回车,换行符,制表符

[复制链接]

升级  12.67%

15

主题

15

主题

15

主题

秀才

Rank: 2

积分
69
 楼主| 发表于 2013-2-7 19:56:47 | 显示全部楼层 |阅读模式
  public static String getonerow(String allLine,String myfind)
    {
           
              Pattern pattern = Pattern.compile("<div class=\"row\">.*?</div>");        
             Matcher  matcher = pattern.matcher(allLine);
            while(matcher.find()) {
                String  myval = matcher.group();
                int npos=myval.indexOf(myfind);
                if(npos>=0)
                {
                    npos = myval.indexOf("<span class=\"cell value\">");
                    if(npos>0)
                    {
                         String content = myval.substring(npos,myval.length());
                         content=content.replaceAll("</?[^>]+>","");   //剔出了<html>的标签
                         content=content.replace(" ","");
                         content=content.replace(".","");
                         content=content.replace("\"","‘");
                         content=content.replace("'","‘");
                         content=content.replaceAll("\\s*|\t|\r|\n","");//去除字符串中的空格,回车,换行符,制表符
                         return content;
                    }
                }
            }
            return "";
   
    }
这仅仅是压缩html的一个模糊概念,以上仅供参考
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表