有人说Java中中文字符占2个字节,也有人说占3个字节,甚至还有人说占4个字节;
有人说Java中英文字符占1个字节,也有人说占2个字节,甚至还有人说占4个字节;
那么到底谁说的对?我的回答是都没错,具体要看是什么编码方式。纸上得来终觉浅,绝知此事要躬行,我编写了下边的代码,运行输出的结果就是答案。
代码如下:
public class Test {public static void main(String[] args){
String[] charsetNames={
"UTF-8", "UTF-16",
"UTF-16BE",
"UTF-16LE",
"UTF-32",
"UTF-32BE",
"UTF-32LE",
"UNICODE",
"GBK",
"GB2312",
"GB18030",
"ISO8859-1",
"BIG5",
"ASCII" };
for(int i=0;i<charsetNames.length;i ){
printByteLength(charsetNames[i]); }
}
/** * String类的不带参数的getBytes()方法会以程序所运行平台的默认编码方式为准来进行转换, * 在不同环境下可能会有不同的结果,因此建议使用指定编码方式的getBytes(String charsetName)方法。 */
public static void printByteLength(String charsetName){
String en="a"; //一个英文字符 String zh="啊"; //一个中文字符 try { System.out.println(charsetName "编码英文字符所占字节数:" en.getBytes(charsetName).length); System.out.println(charsetName "编码中文字符所占字节数:" zh.getBytes(charsetName).length); System.out.println();
} catch (UnsupportedEncodingException e) {
System.out.println("非法编码格式!");
}
}
}
运行结果:
UTF-8编码英文字符所占字节数:1 UTF-8编码中文字符所占字节数:3 UTF-16编码英文字符所占字节数:4 UTF-16编码中文字符所占字节数:4 UTF-16BE编码英文字符所占字节数:2 UTF-16BE编码中文字符所占字节数:2 UTF-16LE编码英文字符所占字节数:2 UTF-16LE编码中文字符所占字节数:2 UTF-32编码英文字符所占字节数:4 UTF-32编码中文字符所占字节数:4 UTF-32BE编码英文字符所占字节数:4 UTF-32BE编码中文字符所占字节数:4 UTF-32LE编码英文字符所占字节数:4 UTF-32LE编码中文字符所占字节数:4 UNICODE编码英文字符所占字节数:4 UNICODE编码中文字符所占字节数:4 GBK编码英文字符所占字节数:1 GBK编码中文字符所占字节数:2 GB2312编码英文字符所占字节数:1 GB2312编码中文字符所占字节数:2 GB18030编码英文字符所占字节数:1 GB18030编码中文字符所占字节数:2 ISO8859-1编码英文字符所占字节数:1 ISO8859-1编码中文字符所占字节数:1 BIG5编码英文字符所占字节数:1 BIG5编码中文字符所占字节数:2 ASCII编码英文字符所占字节数:1 ASCII编码中文字符所占字节数:1
,