python編碼格式

来源:http://www.cnblogs.com/xingyezhi/archive/2016/04/10/5373755.html
-Advertisement-
Play Games

python編碼總結: 1).首先python有兩種格式的字元串,str和unicode,其中unicode相當於位元組碼那樣,可以跨平臺使用。 str轉化為unicode可以通過unicode(),u,str.decode三種方式 unicode轉化為str,如果有中文的話,一般通過encode的方 ...


python編碼總結:

1).首先python有兩種格式的字元串,str和unicode,其中unicode相當於位元組碼那樣,可以跨平臺使用。

str轉化為unicode可以通過unicode(),u,str.decode三種方式

unicode轉化為str,如果有中文的話,一般通過encode的方式

2).如果代碼中有中文的話,我們一般會添加 "# coding=utf-8",這個是什麼作用呢,一般如下:

  1. 如果代碼中有中文註釋,就需要此聲明
  2. 比較高級的編輯器(比如我的emacs),會根據頭部聲明,將此作為代碼文件的格式。
  3. 程式會通過頭部聲明,解碼初始化 u”人生苦短”,這樣的unicode對象,(所以頭部聲明和代碼的存儲格式要一致

    所以,當我們填上編碼頭的時候,使用s="中文",實際上type(s)是一個str,是已經將unicode以utf-8格式編碼成str。

  其次,如果我們在代碼中使用s=u'中文',相當於將str以utf-8解碼成unicode.

 1 # coding=utf-8
 2 __author__ = 'lenovo'
 3 
 4 a='中文'
 5 print a,type(a)
 6 
 7 a2=unicode(a,"utf-8")
 8 print a2,type(a2)
 9 
10 a3=u'中文'
11 print a3,type(a3)

這樣的輸出如下,說明聲明頭的作用一方面是自動將unicode轉化為utf-8,另一方面是使用u的時候指定了utf-8:

 

3)如果在unicode上面再unicode的話,實際上並沒有起到效果

1 a='中文'
2 a2=unicode(a,"utf-8")
3 print a2,type(a2)
4 
5 a3=unicode(a2)
6 print a3,type(a3)

4)u,unicode()和str.decode等價,都可以將str轉化成unicode。但是decode不能像unicode()那樣連續調用

1 a='中文'
2 a2=unicode(a,"utf-8")
3 a3=a.decode("utf-8")
4 print a2,type(a2)
5 print a3,type(a3)

5)當使用map存儲的key為中文的時候,可以str轉化成unicode才行,這樣就可以跨平臺

1 a='中文'
2 map={}
3 map[a.decode('utf-8')]=3
4 map[unicode('t')]=4
5 print map
6 print map[u'中文']
7 print map['t']

6)一個需要註意的點就是ascii碼的話,unicode和str等價,也就是unicode('t')=='t'

7)文件操作時,open(filename),要求文件的格式和編碼頭一致,這樣讀取後是str類型

如果不一致,可以調用io.open()並且指定編碼,這樣讀取後是unicode


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、vagrant 為了模擬集群效果,使用vagrant。 1.1、首先下載vagrant https://www.vagrantup.com/downloads.html 說明:瀏覽器下載可能比較慢,可以通過迅雷下載。 1.2、下載之後,安裝vagrant mac中下一步到底就可以。 說明:雖然v ...
  • 在C語言中,函數名也是指針變數,比如創建了一個add(int n,int m)的函數的同時也創建了一個名為add的指針變數,因此我們可以把函數指針當作一種類型為它賦值、當作參數傳遞等操作 C語言創建函數指針的公式: 返回類型 (*指針變數)(參數類型) 雖然函數指針是指針,但是在使用的時候我們可以省 ...
  • 線程 1.線程的實現 (1)實現線程主要有3中方式:使用內核線程實現,使用用戶線程實現和使用用戶線程加輕量級進程混合實現。 (2)使用內核線程實現 內核線程就是直接由操作系統內核支持的線程,這種線程由內核來完成線程切換,內核通過操縱調度器對線程進行調度,並負責將線程映射到處理器上。 局限性:由於是基 ...
  • 1.request.getSession().getServletContext().getResourceAsStream("/WEB-INF/classes/a.txt""); / 相對對於項目的根路徑 2.getClass().getClassLoader().getResourceAsStr ...
  • 無論是BS還是CS得項目,沒有資料庫是不行的。 本文是對python對mysql的操作的總結。適合有一定基礎的開發者,最好是按部就班學習的人閱讀。因為我認為人生不能永遠都是從零開始,那簡直就是災難。 對於python2.7 和mysql5.7.11 的安裝或使用遇到問題儘量查閱官網的文檔。 pyth ...
  • Git for PyCharm Using PyCharm's Git integration locally:http://confluence.jetbrains.com/display/PYH/Using+PyCharm%27s+Git+integration+locally 創建git集 p... ...
  • #!/usr/bin/env python #coding:utf-8 #定義字典 dic = { "上海":{ "浦東":["張江","唐鎮"], "嘉定":["婁塘","封浜"], "寶山":["羅店","月浦"] }, "北京":{ "海澱":["上地","中關村"], "朝陽":[" ...
  • 本文原創作者:pipi-changing 本文原創出處:http://www.cnblogs.com/pipi-changing/ 本文版權歸作者和博客園共有,未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接 ,否則保留追究法律責任的權利。 函數的定義 什麼是函數? •函數就是定義在類 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...