python3中各個字元編碼的轉換_ZenDei技術網路在線

python3中各個字元編碼的轉換

-Advertisement-

a='我很好' ####python3 預設的編碼為unicode###unicode>gb2312unicode_gb2312=a.encode('gb2312') ###因為預設是unicode所以不需要decode()，直接encode成想要轉換的編碼如gb2312print('我的gb231 ...

a='我很好'    ####python3 預設的編碼為unicode
###unicode>gb2312
unicode_gb2312=a.encode('gb2312') ###因為預設是unicode所以不需要decode()，直接encode成想要轉換的編碼如gb2312
print('我的gb2312',unicode_gb2312)       ###返回結果: 我的gb2312 b'\xce\xd2\xba\xdc\xba\xc3'
###gb2312>utf8
gb2312_utf8=unicode_gb2312.decode('gb2312').encode('utf-8') ##當前字元為gb2312所以要先decode成unicode(decode中傳入的參數為當前字元的編碼集)然後再encode成utf-8
print('我是utf-8',gb2312_utf8)            ###返回結果: 我是utf-8 b'\xe6\x88\x91\xe5\xbe\x88\xe5\xa5\xbd'
###utf8>gbk
utf8_gbk=gb2312_utf8.decode('utf-8').encode('gbk')##當前字元集編碼為utf-8要想轉換成gbk先decode成unicode字元集再encode成gbk字元集
print("我是gbk",utf8_gbk)                 ###返回結果: 我是gbk b'\xce\xd2\xba\xdc\xba\xc3'
###utf8>uicode
utf8_unicode=utf8_gbk.decode('gbk')      ####註意當轉換成unicode時 並不需要encode()
print('我是unicode',utf8_unicode)         ###返回結果: 我是unicode 我很好
###unicode>gb18030
unicode_gb18030=utf8_unicode.encode('gb18030')
print('我是gb18030',unicode_gb18030)      ###返回結果: 我是gb18030 b'\xce\xd2\xba\xdc\xba\xc3'

###總結各個編碼的互相轉換都要先轉換成unicode然後通過unicode再轉換成想要的編碼
##從上面可以看出gb2312 ，gbk，gb18030返回的結果都是一樣的，那是應為這3個都是中國的編碼，所以都是向下互相相容的
##中國的編碼最先出來的是gb2312,然後是gb18030，最後是gbk，它們所支持的字元數也是隨著順序逐漸增多從最初的7000多到現在的近3萬個

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Java—IO流位元組流

IO流（輸入流、輸出流），又分為位元組流、字元流。流是磁碟或其它外圍設備中存儲的數據的源點或終點。輸入流：程式從輸入流讀取數據源。數據源包括外界(鍵盤、文件、網路…)，即是將數據源讀入到程式的通信通道。輸出流：程式向輸出流寫入數據。將程式中的數據輸出到外界（顯示器、印表機、文件、網路…）的通信通 ...
volatile關鍵字

一、基本概念 volatile作為Java虛擬機提供的最輕量級同步機制，用於保證共用變數在多線程的情況下各線程獲取相同，不出現對該變數的操作和其他記憶體操作一樣重排序。重排序在虛擬機上，由於記憶體操作速度遠小於CPU的操作速度，為了減少CPU在等待記憶體操作過程的時間，虛擬機會按照一定規則打亂指令的執 ...
python第七天-作業[購物車]

作業要示: 購物車程式：啟動程式後，輸入用戶名密碼後，如果是第一次登錄，讓用戶輸入工資，然後列印商品列表允許用戶根據商品編號購買商品用戶選擇商品後，檢測餘額是否夠，夠就直接扣款，不夠就提醒可隨時退出，退出時，列印已購買商品和餘額在用戶使用過程中，關鍵輸出，如餘額，商品已加入購物車等消息，需高亮顯 ...
鏈表

與順序表相同，鏈表也是一種線性表，它的數據邏輯組織形式是一維的。而與順序表不同的是，鏈表的物理存儲結構是用一組地址任意的存儲單元存儲數據的。也就是說，它不像鏈表一樣占據一段連續的記憶體空間，而是將存儲單元分散在記憶體的任意地址上。在鏈表結構中，每一個數據元素記錄都存放在鏈表的一個結點中（node）,而每 ...
java泛型探索——小特性

泛型特性（小篇幅） 1. 補充介紹一些常見的泛型特性：類型參數T可以是recursive（類似遞歸性），它的邊界可以是類型參數是自身的介面或類。如我實現尋找最大值的方法，可以這麼寫: 泛型多邊界（Multiple Bounds） 2. Bridges特性對於泛型介面而言，如Comparable ...
Leetcode: 30. Substring with Concatenation of All Words

You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a conca... ...
資料庫連接池兩種配置方式詳解

資料庫連接池: 負責分配、管理和釋放資料庫連接，它允許應用程式重覆使用一個現有的資料庫連接，而再不是重新建立一個；釋放空閑時間超過最大空閑時間的資料庫連接來避免因為沒有釋放資料庫連接而引起的資料庫連接遺漏；資料庫連接池原理: 連接池基本的思想是在系統初始化的時候，將資料庫連接作為對象存儲在記憶體中，當 ...
P3379 【模板】最近公共祖先（LCA）

題目描述如題，給定一棵有根多叉樹，請求出指定兩個點直接最近的公共祖先。輸入輸出格式輸入格式：第一行包含三個正整數N、M、S，分別表示樹的結點個數、詢問的個數和樹根結點的序號。接下來N-1行每行包含兩個正整數x、y，表示x結點和y結點之間有一條直接連接的邊（數據保證可以構成樹）。接下來M行 ...