中文轉碼問題總結

来源:http://www.cnblogs.com/shouce/archive/2016/01/12/5123183.html
-Advertisement-
Play Games

出處:http://www.cnblogs.com/tangyanbo/1. 編碼基礎知識1.1 編碼ISO-8859-1編碼是單位元組編碼,向下相容ASCII,其編碼範圍是0x00-0xFF,0x00-0x7F之間完全和ASCII一致,0x80-0x9F之間是控制字元,0xA0-0xFF之間是文字元...


出處:http://www.cnblogs.com/tangyanbo/

1. 編碼基礎知識

1.1 編碼

ISO-8859-1編碼是單位元組編碼,向下相容ASCII,其編碼範圍是0x00-0xFF,0x00-0x7F之間完全和ASCII一致,0x80-0x9F之間是控制字元,0xA0-0xFF之間是文字元號

單位元組,即一個位元組對應一個編碼,不能編碼漢字

1.2 GBK

1) 能編碼漢字,一個漢字用2個位元組編碼

2) 編碼的漢字比GB2312更多

1.3 GB2312

能編碼漢字,一個漢字用2個位元組編碼

1.4 UTF-8

能編碼漢字,一個漢字用3個位元組編碼

漢字,字母,特殊符號,gbk和utf-8之間是可以互相轉換的

2. Web系統轉換編碼

2.1 原理

這裡邊有個編碼和解碼的過程

網路傳輸發送端需要將字元串編碼成位元組

可以是utf-8,gbk等,轉換成位元組的過程中不能丟失編碼

接收端需要用發送端同樣的編碼方式進行解碼,否則將出現亂碼

一般由服務端確定一種編碼和解碼的方式,

然後告知客戶端編碼和解碼的方式

網路傳輸編碼

2.2.1 接收瀏覽器POST請求

設置瀏覽器編碼和解碼方式為utf-8

如:

<%@ page pageEncoding="utf-8" contentType="text/html; charset=utf-8" language="java"%>

服務端解碼方式1:

String name = new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8");

服務端解碼方式2:

request.setCharacterEncoding("UTF-8");
2.2.2 接收瀏覽器GET請求

如:

http://localhost:8888/webtest/EncodeServlet?name=你好

瀏覽器將會對url進行urlEncode,編碼方式為UTF-8

服務端解碼方式:

String name = new String(request.getParameter("name").getBytes("ISO-8859-1"),"UTF-8");

此處用request.setCharacterEncoding("UTF-8");來設置解碼,不能奏效,原因是get請求將參數拼在url後面進行url encode,而web容器對url的解碼是在調用servlet之前,且預設解碼方式是iso-8859-1

2.2.3 響應給瀏覽器

Response設置編碼:

Response是指響應給客戶端時,位元組的編碼方式,預設為ISO-8859-1

可用如下方法查看:

response.getCharacterEncoding();

設置響應流的編碼方式:

response.setCharacterEncoding("UTF-8");

設置瀏覽器的編碼和解碼方式:

response.setContentType("text/html;charset=UTF-8");

jsp設置:

<%@ page pageEncoding="utf-8" contentType="text/html; charset=utf-8" language="java"%>

pageEncoding:設置jsp文件存儲編碼

contentType裡面的charset:設置瀏覽器端傳輸的編碼和解碼

解析響應時解碼,發送請求時編碼

要保持響應流和編碼和瀏覽器解碼方式一致,才能不亂碼

2.2.4 HTTPClient設置編碼

控制編碼

Struts.xml中做如下配置:

<constant name="struts.i18n.encoding" value="utf-8"></constant>

2.4 Spring控制編碼

Web.xml中配置如下:

複製代碼
<filter>

<filter-name>encodingFilter</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter

</filter-class>

<init-param>

<param-name>encoding</param-name>

<param-value>UTF-8</param-value>

</init-param>

<init-param>

<param-name>forceEncoding</param-name>

<param-value>true</param-value>

</init-param>

</filter>
複製代碼

其中encoding設置服務端編碼和解碼的方式

forceEncoding表示強制編碼的方式

3. 字元串轉位元組轉碼

複製代碼
String s = "s漢";

byte[] bytes1 = s.getBytes("ISO-8859-1");//丟失字元

byte[] bytes2 = s.getBytes("GBK");

byte[] bytes3 = s.getBytes("UTF-8");
複製代碼

4. 位元組轉字元串

String s1 = new String(bytes1,"utf-8");//丟失

String s2 = new String(bytes2,"GBK");

String s3 = new String(bytes3,"utf-8");

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 滑鼠懸浮於鏈接之上出現文字說明效果:對於超鏈接標簽,有一個title屬性,當滑鼠表懸浮於鏈接之上時候,就會顯示title的屬性值,雖然在一定程度上滿足了我們的需要,但是美觀度卻似差強人意,同時無法修改它的樣式,下麵就來介紹一下如何利用jquery模擬實現此功能。代碼如下:螞蟻部落 螞蟻部落 ...
  • 網頁右下角彈出廣告信息框實例代碼:右下角彈出視窗效果是常見的彈出視窗效果之一,比如可以作為廣告視窗,也可以作為網站的一些公告或者通知,非常的實用,下麵就通過實例簡單介紹一下如何實現此功能,代碼如下:網頁右下角的信息框-螞蟻部落 3秒後會在右下角自動彈出視窗,如果沒有彈出請點擊這個按鈕 您有新的短.....
  • div垂直水平居中代碼實例:本章節分享一段代碼實例,它演示瞭如何讓div實現全屏垂直水平居中和指定元素的內容垂直水平居中。代碼實例如下:螞蟻部落 以上代碼實現了我們的要求,能夠實現居中效果,代碼比較簡單,就是基本的邏輯問題。原文地址是:http://www.softwhy.com/forum.ph....
  • jquery如何阻止子元素相應mouseout事件:mouseout有一個特點,當滑鼠移入子元素的時候,也會觸發此事件,但是在實際應用中這個特點往往不是我們想要的,下麵就通過代碼實例介紹一下如何實現此效果,代碼實例如下:螞蟻部落 以上代碼實現了我們的要求,當滑鼠指針移入子div的時候,不會觸發事件....
  • javascript中字元串和數組的相互轉換:字元串和數組的相互轉換操作是非常的重要的,因為在實際編碼過程中會經常用到,所以這是必須要掌握的知識點,當然這個知識點並不難,知道了就永遠知道了,並不是那種需要充分實踐才能夠掌握的東西,下麵就做一下簡單的介紹。一.字元串轉換為數組:此操作會用到split(...
  • 如何實現文本框和驗證碼圖片對齊:在預設情況下,如果文本框和圖片在同一個元素中的話,不能夠實現垂直對齊,比如驗證碼功能,左邊是文本框,右邊是驗證碼圖片,如果不加控制它們是不能夠對齊的,下麵就通過代碼實例介紹一下如何實現文本框和圖片的對齊效果。代碼如下:螞蟻部落以上代碼實現了我們的要求,不過IE6和IE...
  • = 2038) { $year = date ( 'Y' ); } } else { if ($year 12) { $month = date ( 'm' ); } //上一年 ...
  • // ReadSqlConsole.cpp: 主項目文件。#include "stdafx.h"#include #include#include//for setw()#include"windows.h"#import "C:\Program Files\Common Files\System\...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...