Java基礎——字元流

来源:https://www.cnblogs.com/CYan521/archive/2022/04/07/16113802.html
-Advertisement-
Play Games

一、字元流的由來 由於使用位元組流操控中文時不是很方便,Java就提供了字元流來進行操控中文 實現原理:位元組流+編碼表 為什麼用位元組流進行複製帶有中文的文本文件時沒有問題? 因為底層操作會自動進行位元組拼接成中文 怎樣識別該位元組是中文呢? 漢字在存儲時,無論是UTF-8還是GBK,第一個位元組都是負數用來 ...


一、字元流的由來

由於使用位元組流操控中文時不是很方便,Java就提供了字元流來進行操控中文

實現原理:位元組流+編碼表

為什麼用位元組流進行複製帶有中文的文本文件時沒有問題?

因為底層操作會自動進行位元組拼接成中文

怎樣識別該位元組是中文呢?

漢字在存儲時,無論是UTF-8還是GBK,第一個位元組都是負數用來提示

二、編碼表

字元集:

是一個系統支持的所有字元的集合,包括國家文字、標點符號、圖形符號、數字等

電腦要準確的存儲和識別各種字元集符號,就需要進行字元編碼,一套字元集必然至少有一套字元編碼

常見的字元集有ASCII字元集、GBXXX字元集、Unicode字元集等

GBK:最常用的中文碼表,是在GB2312標準基礎上的擴展規範,使用了雙位元組編碼方案,共收錄了21003個漢字,完全相容GB2312標準,同時支持繁體漢字以及日韓漢字等

GB18030:最新的中文碼表,收錄漢字70244個,採用多位元組編碼,每個字可以由1個、2個或4個位元組組成。支持中國少數民族的文字,同時支持繁體漢字以及日韓漢字等

Unicode字元集:

為了表達任意語言的任意字元而設計,是業界的一個標準,也稱為統一碼、標準萬國碼;它最多使用4個位元組的數字來表達每個字母、符號,或者文字。有三種編碼方案:UTF-8、UTF-16、UTF32,最常用的是UTF-8

UTF-8:可以用來表示Unicode標準中的任意字元,它是電子郵件、網頁及其他存儲或傳送文件的應用中,優先採用的編碼。互聯網工作小組要求所有的互聯網協議都必須支持UTF-8編碼格式。它使用一至四個位元組為每個字元編碼

UTF-8編碼規則:

128個US-ASCII字元,只需要一個位元組編碼

拉丁文等字元,需要兩個位元組編碼

大部分常用字(含中文),使用三個位元組編碼

其他極少使用的UniCode輔助字元,使用四個位元組編碼

總結:編碼時使用那種規則,解碼就需要採用對應的規則,否則會亂碼

三、字元串中的編碼解碼問題

編碼方法(IDEA):

byte[] getBytes():使用平臺預設的字元集將該String編碼為一系列位元組,將結果存儲到新的位元組數組中

byte[] getBytes(String charsetName):使用指定的字元集將該String編碼為一系列位元組,將結果存儲到新的位元組數組中

解碼方法(IDEA):

String(byte[]bytes):通過使用平臺的預設字元集解碼指定的位元組數組來構造新的String

String(byte[]bytes,String charsetName):通過指定的字元集解碼指定的位元組數組來構造新的String

IDEA中預設的編碼格式是UTF-8

四、字元流的編碼解碼問題

字元流抽象基類:

Reader:字元輸入流的抽象類

Writer:字元輸出流的抽象類

字元流中和編碼解碼問題相關的兩個類:

InputStreamReader:是從位元組流到字元流的橋梁:它讀取位元組,並使用指定的字元集將其解碼為字元。它使用的字元集可以由名稱指定,也可以被明確指定,或者可以接受平臺的預設字元集

構造方法:

InputStreamReader(InputStream in)創建一個使用預設字元集的InputStreamReader。
InputStreamReader(InputStream in, String charsetName) 創建一個使用命名字元集的InputStreamReader。

OutputStreamWruter:是從字元流到位元組流的橋梁:使用自訂的字元集將寫入的字元編碼為位元組,它使用的字元集可以由名稱指定,也可以被明確指定,或者可以接受平臺的預設字元集

構造方法:

OutputStreamWriter(OutputStream out)創建一個使用預設字元編碼的OutputStreamWriter。
OutputStreamWriter(OutputStream out, String charsetName) 創建一個使用命名字元集的OutputStreamWriter。

 

public class ConversionStreamDemo {
  public static void main(String[] args) throws IOException {
      //創建一個預設編碼格式的InputStreamReader\OutputStreamWriter
      InputStreamReader ipsr = new InputStreamReader(new FileInputStream("E:\\abc.txt"));
      OutputStreamWriter opsw = new OutputStreamWriter(new FileOutputStream("E:\\abc.txt"));
      //寫入數據
      opsw.write("你好啊");
      opsw.close();
      //讀數據,方式一:一次讀取一個位元組數據
      int ch;
      while ((ch = ipsr.read()) != -1) {
          System.out.print((char) ch);
      }
      ipsr.close();

  }
}

四、字元流寫數據的五種方法

方法名說明
void write(int c) 寫一個字元
void write(char[] cbuf) 寫入一個字元數組
void write(char[] cbuf,int off,int len) 寫入字元數組的一部分
void write(String str) 寫入一個字元串
void write(String str,int off,int len) 寫入一個字元串的一部分

字元流寫數據需要註意緩衝區的問題,如果想要將緩衝區的數據載入出來需要在寫入方法後加上刷新方法flush();

前三個方法與位元組流寫入方法使用相同,這裡重點介紹下麵兩種方式

public class OutputStreamWriterDemo {
  public static void main(String[] args) throws IOException {
      //創建一個預設編碼格式的OutputStreamWriter對象
      OutputStreamWriter opsw=new OutputStreamWriter(new FileOutputStream("E:\\abc.txt"));
      //方式一:寫入一個位元組
      opsw.write(97);
      opsw.flush();//如果需要在文件中立即顯示輸入的數據,就需要加入刷新方法
      //方式二:寫入一個字元數組
      char[]ch={'a','b','c','二'};
      opsw.write(ch);
      opsw.flush();//如果需要在文件中立即顯示輸入的數據,就需要加入刷新方法
      //方式三:寫入一個字元數組的一部分
      opsw.write(ch,0,2);
      opsw.flush();//如果需要在文件中立即顯示輸入的數據,就需要加入刷新方法
      //方式四:寫入一個字元串
      opsw.write("一二三");
      opsw.flush();//如果需要在文件中立即顯示輸入的數據,就需要加入刷新方法
      //方式五:寫入一個字元串的一部分
      opsw.write("三四五",1,2);
      opsw.flush();//如果需要在文件中立即顯示輸入的數據,就需要加入刷新方法
  }
}

五、字元流讀數據的兩種方法

方法名說明
int read() 一次讀取一個字元數據
int read(char[] cbuf) 一次讀取一個字元數組數據
public class InputStreamReadDemo {
  public static void main(String[] args) throws IOException {
      //創建一個預設編碼格式的InputStreamReader
      InputStreamReader ipsr=new InputStreamReader(new FileInputStream("E:\\abc.txt"));
      //讀取數據,方式一一次讀取一個字元數據
      int ch;
      while ((ch=ipsr.read())!=-1){
          System.out.print((char) ch);
      }
      ipsr.close();
      //方式二:一次讀取一個字元數組數據
      char []ch=new char[1024];
      int len;
      while ((len=ipsr.read(ch))!=-1){
          System.out.print(new String(ch,0,len));
      }
      ipsr.close();
  }
}

小結:如果使用預設編碼格式的話,那麼字元輸入流InputStreamReader可以使用子類FileReader來替代,字元輸出流OutputStreamWriter可以使用其子類FileWriter來替代,兩者在使用預設編碼格式的情況下作用一致。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 郵件任務-springboot springboot可以很容易實現郵件的發送 具體實現步驟: 導入jar包 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-mail</a ...
  • 目錄 一.簡介 二.猜你喜歡 零基礎 OpenGL (ES) 學習路線推薦 : OpenGL (ES) 學習目錄 >> OpenGL ES 基礎 零基礎 OpenGL (ES) 學習路線推薦 : OpenGL (ES) 學習目錄 >> OpenGL ES 轉場 零基礎 OpenGL (ES) 學習路 ...
  • 模式匹配 控制流運算符——match: 其允許一個值與一系列模式進行匹配,並執行匹配的模式對應的代碼 這些模式可以是字面值、變數名、通配符... 綁定值的模式: 匹配的分支可以綁定到被匹配對象的部分值 因此,可以從 enum 變體中提取值 //綁定值 #[derive(Debug)] enum Us ...
  • 1. 求數值型數組中元素的最大值、最小值、平均值、總值等 2. 數組的複製、反轉、查找(線性查找、二分法查找) ...
  • 非同步任務-springboot 非同步:非同步與同步相對,當一個非同步過程調用發出後,調用者在沒有得到結果之前,就可以繼續執行後續操作。也就是說無論非同步方法執行代碼需要多長時間,跟主線程沒有任何影響,主線程可以繼續向下執行。 實例: 在service中寫一個hello方法,讓它延遲三秒 @Service ...
  • 由於``某些不可抗力原因,公司不允許使用itext系列的jar包,因此系統中使用的相關jar得替換成開源的。經比較和嘗試考慮使用org.apache.pdfbox來替換,同時修改系統中原有的方法,發現比itext系列稍顯簡潔一點,記錄如下: 加密文件 /** * 加密文件測試 * @date 202 ...
  • 背景 在項目使用了Spring Security之後,很多介面無法訪問了,從瀏覽器的網路調試窗看到的是CORS的報錯和403的報錯 分析 我們先來看一下CORS是什麼,和它很相似的CSRF是什麼,在SpringSecurity中如何配置以及起的什麼作用 CORS(Cross Origin Resou ...
  • 本文我們來看下 SpringSecurity + JWT 實現單點登錄操作,本文 2W 字,預計閱讀時間 30 min,文章提供了代碼骨架,建議收藏。 一、什麼是單點登陸 單點登錄(Single Sign On),簡稱為 SSO,是目前比較流行的企業業務整合的解決方案之一。SSO的定義是在多個應用系 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...