freezxq 发表于 2013-2-7 03:38:21

Dom4j无法以UTF-8保存xml文件,Invalid byte 2 of 2-byte UTF-8 sequence

xml页面出现Invalid byte 2 of 2-byte UTF-8 sequence错误警告。

问题描述:
最终发现这个问题是适用dom解析时无法以UTF-8保存xml文件,保存后再次读出的时候会报“Invalid byte 2 of 2-byte UTF-8 sequence.”这样一个错误,试着使用GBK编码生成的xml文件却可以正常的被解析,保存不会出现错误,而且再次读出时,也不会在面对错误提示。

修改方法:
在...xml文件中在第一行中改变编码方式即可,如:
<?xml version="1.0" encoding="GBK"?>

解析:dom是应用FileWriter对象进行文件输出的,而继承下来的子类没有提供编码处理。所以保存文件时以默认的编码格式保存,对于中文windows下Java的默认编码是GBK.
页: [1]
查看完整版本: Dom4j无法以UTF-8保存xml文件,Invalid byte 2 of 2-byte UTF-8 sequence