透徹分析和解決一切javaWeb項目亂碼問題

来源:https://www.cnblogs.com/xiaoming0601/archive/2020/02/13/12304418.html
-Advertisement-
Play Games

前言 亂碼是我們在程式開發中經常碰到且讓人頭疼的一件事,尤其是我們在做javaweb開發,如果我們沒有清楚亂碼產生的原理,碰到亂碼問題了就容易摸不著頭腦,無從下手。 亂碼主要出現在兩部分,如下: 第一,瀏覽器通過表單提交到後臺,如果表單內容有中文,那麼後臺收到的數據可能會出現亂碼。 第二,後端伺服器 ...


前言

亂碼是我們在程式開發中經常碰到且讓人頭疼的一件事,尤其是我們在做javaweb開發,如果我們沒有清楚亂碼產生的原理,碰到亂碼問題了就容易摸不著頭腦,無從下手。

亂碼主要出現在兩部分,如下:

第一,瀏覽器通過表單提交到後臺,如果表單內容有中文,那麼後臺收到的數據可能會出現亂碼。

第二,後端伺服器需要返回給瀏覽器數據,如果數據中帶有中文,那麼瀏覽器上可能會顯示亂碼。

接下來我們逐一分析亂碼產生的原因,以及如何解決亂碼問題。

一、後端收到瀏覽器提交的中文亂碼

這裡又分為get請求和post請求。

get請求

get請求,請求參數中帶有中文,後臺接收會出現亂碼,原因是tomcat預設編碼是“ISO-8859-1”,所以tomcat會使用“ISO-8859-1”對中文進行編碼,該編碼不支持中文,所以後臺接收到就亂碼了。解決方式有兩種。

  1. param = new String(param.getBytes("ISO-8859-1"),"utf-8");
  2. 修改tomcat編碼為"utf-8",不建議使用這種方式。

post請求

post請求,出現亂碼的原因同get請求,解決方式比較簡單,如下:

request.setCharacterEncoding("utf-8");

設置請求參數的編碼格式為“utf-8”,這樣就不會有問題了。

二、後端返回中文給瀏覽器發生亂碼

後端返回數據給瀏覽器,一般也有兩種形式,一種是response.getOutputStream(),一種是response.getWriter()。

兩者區別以及使用規則

  • getOutputStream()就是得到了OutputStream,用來向客戶端(瀏覽器)輸出任何數據,如果輸出的是字元,會被轉換成二進位輸出,如果字元中出現中文,那麼會出現“java.io.CharConversionException:Not an ISO 8859-1 character:”異常
  • getWriter()是對outputStream進行了包裝,用來輸出字元用的。

因此,調用requonse.getWriter()方法時可實現文本字元串數據輸出,調用response.getOutputStream()方法可現實位元組流數據的輸出。所以,如果要輸出圖片等二進位數據時,需要使用response.getOutputStream。

註意,getOutputStream()和getWriter()不能同時使用,否則會拋出”getWriter() has already been called for this response“異常。

區別講完了,下麵我們主要還是通過實踐分析下亂碼產生的原理。

response.getOutputStream().print()

返回英文數據就不說了,沒什麼問題,看下返回中文是什麼效果;

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油,武漢加油";
    response.getOutputStream().print(str);
}

結果如下:

分析:

OutPutStream是輸出二進位數據的,所以需要對字元串改成二進位輸出,Tomcat使用的是"ISO8859-1"編碼對其進行轉換,而中文對”ISO859-1“不支持,所以就拋異常了。

response.getOutputStream.write()

同樣的,我們再來看下輸出中文會怎麼樣。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油,武漢加油";
    response.getOutputStream().write(str.getBytes());
}

頁面輸出結果如下:

涓浗鍔犳補錛屾奼夊姞娌�

分析:

在java中,String的getBytes()方法是得到一個操作系統預設的編碼格式的位元組數組,我電腦的系統是macos,預設編碼格式是utf-8,返回給瀏覽器是utf-8編碼格式的位元組數組,但是瀏覽器預設是"gbk"編碼解析,所以就亂碼了。

既然這樣,那我們換成“gb2312”編碼(gb2312編碼是gbk編碼的一種)試試呢?

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油,武漢加油";
    response.getOutputStream().write(str.getBytes());
}

頁面輸出:

中國加油,武漢加油

原理我們弄清楚了,但是在項目開發中,我們需要編碼統一,最常用的就是中文字元編碼"UTF-8",可是按照我們的理解,如果我們直接response.getOutputStream().write(str.getBytes("utf-8"));肯定會亂碼,我們需要用某種方式,告訴瀏覽器,你要用我指定的“utf-8”編碼接受我返回的中文。response.setContentType("text/html;charset=UTF-8")這樣就完事了,看看效果吧。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油,武漢加油";
    response.setContentType("text/html;charset=utf-8");
    response.getOutputStream().write(str.getBytes("utf-8"));
}

頁面輸出:

中國加油,武漢加油

response.getWriter()

前面已經總結過了,response.getWriter()跟response.getOutputStream()不一樣,outputStream是輸出二進位的,writer是輸出字元串的。response.getWriter()輸出也有兩種方法,一種是print(),一種是write(),其實兩者在處理亂碼這一塊沒有什麼區別,就不分開講述了。

示例:

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油,武漢加油";
    response.getWriter().print(str);
}

頁面輸出:

?????????

分析:

同樣的,Tomcat預設的編碼是ISO 8859-1,當我們輸出中文數據的時候,Tomcat會依據ISO 8859-1碼表給我們的數據編碼,中文不支持這個碼表呀,所以出現了亂碼。

這個時候response.setContentType("text/html;charset=UTF-8")又派上用場了。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中國加油,武漢加油";
    response.setContentType("text/html;charset=utf-8");
    response.getWriter().print(str);
}

頁面輸出:

中國加油,武漢加油

在這裡,response.setContentType("text/html;charset=UTF-8")做了兩件事,response.setCharacterEncoding("UTF-8");和response.setHeader("Content-Type", "text/html;charset=UTF-8");具體就是,第一,輸出中文”中國加油,武漢加油“的時候,對中文進行”utf-8“編碼;第二,告訴瀏覽器,你也要用"utf-8"來顯示我返回的中文

最後

對於springMVC項目,如何解決亂碼問題呢?項目中一般會在web.xml中配置編碼過濾器。配置如下:

  <filter>
    <filter-name>encodingFilter</filter-name>
    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
    <init-param>
      <param-name>encoding</param-name>
      <param-value>UTF-8</param-value>
    </init-param>
    <init-param>
      <param-name>forceEncoding</param-name>
      <param-value>true</param-value>
    </init-param>
  </filter>
  <filter-mapping>
    <filter-name>encodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
  </filter-mapping>

這樣能保證請求的參數按照指定的編碼格式進行編碼,簡單翻看下過濾器源碼如下:

@Override
    protected void doFilterInternal(
            HttpServletRequest request, HttpServletResponse response, FilterChain filterChain)
            throws ServletException, IOException {

        if (this.encoding != null && (this.forceEncoding || request.getCharacterEncoding() == null)) {
            request.setCharacterEncoding(this.encoding);
            if (this.forceEncoding) {
                response.setCharacterEncoding(this.encoding);
            }
        }
        filterChain.doFilter(request, response);
    }

代碼中有兩處重要的地方值得註意,分別是request.setCharacterEncoding(this.encoding);和response.setCharacterEncoding(this.encoding);前者表示我們對請求過來的參數使用指定的"utf-8"進行編碼,後者便是,返回給瀏覽器時,後端返回字元的編碼是“utf-8”。

好了,經過以上分析是不是亂碼也沒有那麼可怕了。只要明白其中的緣由,解決起來就是一行代碼或者幾行配置的事兒了,如果大家覺得有幫助,不妨點贊支持一下

如果大家覺得我寫的不錯、清晰易懂的話,可以關註我的公眾號“灰太狼學爪哇”,不定期分享原創技術文章,與君共勉。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • windows破解教程 1. 首先下載jar包:(雲盤鏈接發不上去,大家關註gzh" 灰太狼學爪哇 "回覆 idea 獲取)將其放到合適的文件夾(首選IDEA的同級目錄)進行管理; 2. 進入C盤 — 用戶 — 用戶名 — .IntelliJIdea2019.2或者.IntelliJIdea2019 ...
  • VisualVM在Java 8中是JDK自帶的一個圖形化工具,項目主頁 "VisualVM" ,在後續版本中可能會從JDK移除。 VisualVM可以監控Java進程的CPU與記憶體占用情況,可以監控Java進程內的各個線程的執行情況,還可以與MAT工具一樣用來分析堆轉儲快照。 監控遠程Tomcat進 ...
  • 1.前提條件 1). 確保已經安裝需要的Python版本 2). 確保已經將Python的目錄加入到環境變數中 2. Python安裝包的幾種常用方式 1). pip安裝方式(正常線上安裝) 2). whl安裝方式(離線安裝),一般是.whl格式的包 3). 源碼安裝方式(離線安裝),tar.gz/ ...
  • 概念: 什麼是REST? REST是Representational State Transfer的縮寫。翻譯為"表現層狀態轉化",restful是一種介面設計風格,它不是一個協議,通常是基於HTTP協議的; 為什麼需要這麼一個風格呢? RESTful的重點之一就是統一的介面命名規則; 每個開發者可 ...
  • 請求限制 一些情況下我們可能需要對請求進行限制,比如僅允許POST,GET等... RequestMapping註解中提供了多個參數用於添加請求的限制條件 value 請求地址 path 請求地址 method 請求方法 headers 請求頭中必須包含指定欄位 params 必須包含某個請求參數 ...
  • 一.用字典映射代替switch case語句 if/else可以代替switch但是非常不合適。 用字典代替switch: day = 5 switcher = { 0:'Sunday', 1:'Monday', 2:'Tuesday' } day_name = switcher.get(day,' ...
  • 我一直想用 Python and Selenium 創建一個網頁爬蟲,但從來沒有實現它。 幾天前, 我決定嘗試一下,這聽起來可能是挺複雜的, 然而編寫代碼從 Unsplash 抓取一些美麗的圖片還是挺容易的。 PS:很多人在學習Python的過程中,往往因為遇問題解決不了或者沒好的教程從而導致自己放 ...
  • 作為非專業的python選手,或者非專業的爬蟲選手,即使我們有一些編程基礎,有時想通過代碼從網上獲取一些信息,也不能徒手就能做,需要借鑒一些成熟的方案、代碼。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...