文件的編碼 執行結果: 文本文件就是位元組序列,可以是任意編碼的位元組序列。 如果我們在中文機器上直接創建文本文件,那麼該文本文件只認識ansi編碼(中文系統下,ansi編碼代表gbk編碼) ...
- 文件的編碼
package cn.test; import java.io.UnsupportedEncodingException; public class Demo15 { public static void main(String[] args) throws UnsupportedEncodingException { String str = "你好ABC123"; byte[] b1 = str.getBytes();//轉換成位元組系列用的是項目預設的編碼 for (byte b : b1) { //把位元組(轉換成了int)以十六進位方式顯示 System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //utf8編碼,中文占用3個位元組,英文和數字占用1個位元組 byte[] b2 = str.getBytes("utf8"); for (byte b : b2) { System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //gbk編碼,中文占用兩個位元組,英文和數字占用1個位元組 byte[] b3 = str.getBytes("gbk"); for (byte b : b3) { System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //java是雙位元組編碼 utf-16be //utf-16be編碼,中文占2個位元組,英文和數字也占用2個位元組 byte[] b4 = str.getBytes("utf-16be"); for (byte b : b4) { System.out.print(Integer.toHexString(b & 0xff) + " "); } System.out.println(""); //當位元組序列是某種編碼時,這時候想把位元組序列變成字元串,也需要用這種編碼方式,否則會出現亂碼 String str1 = new String(b4);//使用項目預設的編碼 System.out.println(str1); String str2 = new String(b4, "utf-16be"); System.out.println(str2); } }
執行結果:
e4 bd a0 e5 a5 bd 41 42 43 31 32 33 e4 bd a0 e5 a5 bd 41 42 43 31 32 33 c4 e3 ba c3 41 42 43 31 32 33 4f 60 59 7d 0 41 0 42 0 43 0 31 0 32 0 33 O`Y}ABC123 你好ABC123
文本文件就是位元組序列,可以是任意編碼的位元組序列。
如果我們在中文機器上直接創建文本文件,那麼該文本文件只認識ansi編碼(中文系統下,ansi編碼代表gbk編碼)