六狼论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

搜索
查看: 112|回复: 0

java解析html

[复制链接]

升级  83.33%

51

主题

51

主题

51

主题

秀才

Rank: 2

积分
175
 楼主| 发表于 2013-2-7 19:25:26 | 显示全部楼层 |阅读模式
import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class ParserHTML {

public static void main(String[] args){
String filePath = "d:\\xx.html";
parseHTML(filePath);
}

private static void parseHTML(String filePath) {
try{
Document document = getDocumentInstance(filePath);
Element root = document.getDocumentElement();
NodeList nodeList = root.getElementsByTagName("form").item(0).getChildNodes();
for(int i=0;i<nodeList.getLength();i++){
Node subNode = nodeList.item(i);
if(subNode.getNodeType() == Node.ELEMENT_NODE){
Element eNode = (Element)subNode;
if(eNode.getTagName().equals("input")){
String name = subNode.getAttributes().getNamedItem("name").getNodeValue().toString();
String value = subNode.getAttributes().getNamedItem("value").getNodeValue().toString();
System.out.println("name=" + name + "  value=" + value);
}
}
}
}catch(Exception e){
System.out.println("errMsg: " + e.getMessage());
}
}

private static Document getDocumentInstance(String filePath)throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder db = factory.newDocumentBuilder();
return db.parse(new File(filePath));
}

java解析html表单以获取input值,源码已经过测试。备以后用。
您需要登录后才可以回帖 登录 | 立即注册 新浪微博账号登陆

本版积分规则

快速回复 返回顶部 返回列表