python編碼格式_ZenDei技術網路在線

python編碼格式

-Advertisement-

python編碼總結： 1).首先python有兩種格式的字元串，str和unicode，其中unicode相當於位元組碼那樣，可以跨平臺使用。 str轉化為unicode可以通過unicode()，u，str.decode三種方式 unicode轉化為str，如果有中文的話，一般通過encode的方 ...

python編碼總結：

1).首先python有兩種格式的字元串，str和unicode，其中unicode相當於位元組碼那樣，可以跨平臺使用。

str轉化為unicode可以通過unicode()，u，str.decode三種方式

unicode轉化為str，如果有中文的話，一般通過encode的方式

2).如果代碼中有中文的話，我們一般會添加 "# coding=utf-8"，這個是什麼作用呢，一般如下：

如果代碼中有中文註釋，就需要此聲明
比較高級的編輯器（比如我的emacs），會根據頭部聲明，將此作為代碼文件的格式。
程式會通過頭部聲明，解碼初始化 u”人生苦短”，這樣的unicode對象，（所以頭部聲明和代碼的存儲格式要一致

所以，當我們填上編碼頭的時候，使用s="中文"，實際上type(s)是一個str，是已經將unicode以utf-8格式編碼成str。

　其次，如果我們在代碼中使用s=u'中文'，相當於將str以utf-8解碼成unicode.

 1 # coding=utf-8
 2 __author__ = 'lenovo'
 3 
 4 a='中文'
 5 print a,type(a)
 6 
 7 a2=unicode(a,"utf-8")
 8 print a2,type(a2)
 9 
10 a3=u'中文'
11 print a3,type(a3)

這樣的輸出如下，說明聲明頭的作用一方面是自動將unicode轉化為utf-8，另一方面是使用u的時候指定了utf-8：

3)如果在unicode上面再unicode的話，實際上並沒有起到效果

1 a='中文'
2 a2=unicode(a,"utf-8")
3 print a2,type(a2)
4 
5 a3=unicode(a2)
6 print a3,type(a3)

4)u,unicode()和str.decode等價，都可以將str轉化成unicode。但是decode不能像unicode()那樣連續調用

1 a='中文'
2 a2=unicode(a,"utf-8")
3 a3=a.decode("utf-8")
4 print a2,type(a2)
5 print a3,type(a3)

5)當使用map存儲的key為中文的時候，可以str轉化成unicode才行，這樣就可以跨平臺

1 a='中文'
2 map={}
3 map[a.decode('utf-8')]=3
4 map[unicode('t')]=4
5 print map
6 print map[u'中文']
7 print map['t']

6)一個需要註意的點就是ascii碼的話，unicode和str等價，也就是unicode('t')=='t'

7)文件操作時，open(filename)，要求文件的格式和編碼頭一致，這樣讀取後是str類型

如果不一致，可以調用io.open()並且指定編碼，這樣讀取後是unicode

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

第四章 consul cluster

1、vagrant 為了模擬集群效果，使用vagrant。 1.1、首先下載vagrant https://www.vagrantup.com/downloads.html 說明：瀏覽器下載可能比較慢，可以通過迅雷下載。 1.2、下載之後，安裝vagrant mac中下一步到底就可以。說明：雖然v ...
C語言學習019:函數指針

在C語言中，函數名也是指針變數，比如創建了一個add(int n,int m)的函數的同時也創建了一個名為add的指針變數，因此我們可以把函數指針當作一種類型為它賦值、當作參數傳遞等操作 C語言創建函數指針的公式: 返回類型 (*指針變數)(參數類型) 雖然函數指針是指針，但是在使用的時候我們可以省 ...
JVM-併發-線程

線程 1.線程的實現（1）實現線程主要有3中方式：使用內核線程實現，使用用戶線程實現和使用用戶線程加輕量級進程混合實現。（2）使用內核線程實現內核線程就是直接由操作系統內核支持的線程，這種線程由內核來完成線程切換，內核通過操縱調度器對線程進行調度，並負責將線程映射到處理器上。局限性：由於是基 ...
javaweb中載入外部文件的三種方式

1.request.getSession().getServletContext().getResourceAsStream("/WEB-INF/classes/a.txt""); / 相對對於項目的根路徑 2.getClass().getClassLoader().getResourceAsStr ...
python針對於mysql的增刪改查

無論是BS還是CS得項目，沒有資料庫是不行的。本文是對python對mysql的操作的總結。適合有一定基礎的開發者，最好是按部就班學習的人閱讀。因為我認為人生不能永遠都是從零開始，那簡直就是災難。對於python2.7 和mysql5.7.11 的安裝或使用遇到問題儘量查閱官網的文檔。 pyth ...
Git for PyCharm

Git for PyCharm Using PyCharm's Git integration locally：http://confluence.jetbrains.com/display/PYH/Using+PyCharm%27s+Git+integration+locally 創建git集 p... ...
python三級菜單

#!/usr/bin/env python #coding:utf-8 #定義字典 dic = { "上海":{ "浦東":["張江","唐鎮"], "嘉定":["婁塘","封浜"], "寶山":["羅店","月浦"] }, "北京":{ "海澱":["上地","中關村"], "朝陽":[" ...
函數、記憶體、一維數組、二維數組【4】

本文原創作者：pipi-changing 本文原創出處：http://www.cnblogs.com/pipi-changing/ 本文版權歸作者和博客園共有，未經作者同意必須保留此段聲明，且在文章頁面明顯位置給出原文連接，否則保留追究法律責任的權利。函數的定義什麼是函數？ •函數就是定義在類 ...