Python_實用入門篇_05

来源:https://www.cnblogs.com/RedMolly/archive/2018/08/24/9527872.html
-Advertisement-
Play Games

編碼及運算符 1.編碼 1.編碼的概念 在電腦硬體中,編碼(coding)是指用代碼來表示各組數據資料,使其成為可利用電腦進行處理和分析的信息。代碼是用來表示事物的記號,它可以用數字、字母、特殊的符號或它們之間的組合來表示。 2.編碼的種類(常用種類) ①ASCCI 1.ASCCI的產生 在計算 ...


編碼及運算符 


1.編碼 

  1.編碼的概念

    電腦硬體中,編碼(coding)是指用代碼來表示各組數據資料,使其成為可利用電腦進行處理和分析的信息。代碼是用來表示事物的記號,它可以用數字、字母、特殊的符號或它們之間的組合來表示。

  2.編碼的種類(常用種類)

    ①ASCCI

      1.ASCCI的產生

          在電腦中,所有的數據在存儲和運算時都要使用二進位數表示(因為電腦用高電平和低電平分別表示1和0),例如,像a、b、c、d這樣的52個字母(包括大寫)、以及0、1等數字還有一些常用的符號(例如*、#、@等)在電腦中存儲時也要使用二進位數來表示,而具體用哪些二進位數字表示哪個符號,當然每個人都可以約定自己的一套(這就叫編碼),而大家如果要想互相通信而不造成混亂,那麼大家就必須使用相同的編碼規則,於是美國有關的標準化組織就出台了ASCII編碼,統一規定了上述常用符號用哪些二進位數來表示。

 

          2.ASCCI的表述

          ASCII 碼使用指定的7 位或8 位二進位數組合來表示128 或256 種可能的字元。標準ASCII 碼也叫基礎ASCII碼,使用7 位二進位數(剩下的1位二進位為0)來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊控制字元

字母A用ASCII編碼是十進位的65,二進位的01000001;

        ②unicode

      1.Unicode的產生

          unicode碼擴展自ASCII 字元集。在嚴格的ASCII中,每個字元用7位元表示,或者電腦上普遍使用的每字元有8位元寬。如果要表示中文,顯然一個位元組是不夠的,至少需要兩個位元組,而且還不能和ASCII編碼衝突,所以,中國制定了GB2312編碼,用來把中文編進去。類似的,日文和韓文等其他語言也有這個問題。為了統一所有文字的編碼,Unicode應運而生。Unicode把所有語言都統一到一套編碼里,這樣就不會再有亂碼問題了。

          2.Unicode的表述

            Unicode通常用兩個位元組表示一個字元,原有的英文編碼從單位元組變成雙位元組,只需要把高位元組全部填為0就可以。在Unicode中:漢字“字”對應的數字是23383(十進位),十六進位表示為5B57。在Unicode中,我們有很多方式將數字23383表示成程式中的數據

漢字“中”已經超出了ASCII編碼的範圍,用Unicode編碼是十進位的20013,二進位的01001110 00101101。

     ③UTF-8

        1.UTF-8的產生

          事實證明,對可以用ASCII表示的字元使用Unicode並不高效,因為Unicode比ASCII占用大一倍的空間,而對ASCII來說高位元組的0對他毫無用處。為瞭解決這個問題,就出現了一些中間格式的字元集,他們被稱為通用轉換格式,即UTF(Unicode Transformation Format)。常見的UTF格式有:UTF-7, UTF-7.5, UTF-8,UTF-16, 以及 UTF-32。這裡只介紹UTF-8。

        2.UTF-8的表述

          UTF-8以位元組為單位對Unicode進行編碼。從Unicode到UTF-8的編碼方式如下:

Unicode編碼(十六進位) UTF-8 位元組流(二進位)
000000-00007F 0xxxxxxx
000080-0007FF 110xxxxx 10xxxxxx
000800-00FFFF 1110xxxx 10xxxxxx 10xxxxxx
010000-10FFFF 11110xxx10xxxxxx10xxxxxx10xxxxxx

           UTF-8的特點是對不同範圍的字元使用不同長度的編碼。對於0x00-0x7F之間的字元,UTF-8編碼與ASCII編碼完全相同。UTF-8編碼的最大長度是4個位元組。從上表可以看出,4位元組模板有21個x,即可以容納21位二進位數字。Unicode的最大碼位0x10FFFF也只有21位。

字元    ASCII              Unicode                                      UTF-8
A    01000001         00000000 01000001                               01000001
中       x            01001110 00101101                      11100100 10111000 10101101

註意(你看到很多網頁的源碼上會有類似<meta charset="UTF-8" />的信息,表示該網頁正是用的UTF-8編碼)

 

     ④GBK

      1.GBK的產生

         GBK全稱《漢字內碼擴展規範》(GBK即“國標”、“擴展”漢語拼音的第一個字母,英文名稱:Chinese Internal Code Specification) ,中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂,國家技術監督局標準化司、電子工業部科技與質量監督司1995年12月15日聯合以技監標函1995 229號文件的形式,將它確定為技術規範指導性文件。這一版的GBK規範為1.0版。因為目前大家使用的主要是GB編碼字型檔,此編碼標準只收錄了6763個常用漢字,而GB字型檔以外大量漢字,只能通過方正女媧補字軟體拼字或其它造字程式補字。儘管補出的漢字在字形上滿足需要,但在字體風格、大小、結構方面難以協調統一,而採用手工貼圖的方式補字,更不雅觀。進而言之,如果用戶建立信息系統,或需要查詢新聞、出版內容時,靠補字是無法實現的。方正開發的GBK字型檔,將極大地緩解缺字現象。

        2.GBK的表述

          GBK 亦採用雙位元組表示,總體編碼範圍為 8140-FEFE,首位元組在 81-FE 之間,尾位元組在 40-FE 之間,剔除 xx7F 一條線。總計 23940 個碼位,共收入 21886 個漢字和圖形符號,其中漢字(包括部首和構件)21003 個,圖形符號 883 個。相容ASCCI。

2.Python中的編碼轉碼

    1.Python的編碼方式

       因為電腦只能處理數字,如果要處理文本,就必須先把文本轉換為數字才能處理。最早的電腦在設計時採用8個比特(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位11111111=十進位255),如果要表示更大的整數,就必須用更多的位元組。比如兩個位元組可以表示的最大整數是65535,4個位元組可以表示的最大整數是4294967295在最新的Python 3版本中,字元串是以Unicode編碼的,也就是說,Python的字元串支持多語言

      2.python中的字元串編碼

        由於Python的字元串類型是str,在記憶體中以Unicode表示,一個字元對應若幹個位元組。如果要在網路上傳輸,或者保存到磁碟上,就需要把str變為以位元組為單位的bytes

Python對bytes類型的數據用帶b首碼的單引號或雙引號表示:

x = b'ABC'
>>> 'ABC'.encode('ascii')
b'ABC'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
>>> '中文'.encode('ascii')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

                   3.Python中的轉碼解碼和len()方法

          encode(轉碼),decode(解碼)。

x = b'ABC'
>>> 'ABC'.encode('ascii')
b'ABC'
>>> '中文'.encode('utf-8')
b'\xe4\xb8\xad\xe6\x96\x87'
>>> b'ABC'.decode('ascii')
'ABC'
>>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
'中文'

         len()函數:計算一個對象長度,如果換成byteslen()函數就計算位元組數。

>>> len(b'ABC')
3
>>> len(b'\xe4\xb8\xad\xe6\x96\x87')
6
>>> len('中文'.encode('utf-8'))
6

3.運算符

       1.運算符概念

        運算符用於執行程式代碼運算,會針對一個以上操作數項目來進行運算。例如:2+3,其操作數是2和3,而運算符則是“+”。在vb2005中運算符大致可以分為5種類型:算術運算符、連接運算符、關係運算符賦值運算符邏輯運算符

    2.Python中的運算符      

運算符優先順序 ↓   

 

運算符描述
** 指數 (最高優先順序)
~ + - 按位翻轉, 一元加號和減號 (最後兩個的方法名為 +@ 和 -@)
* / % // 乘,除,取模和取整除
+ - 加法減法
>> << 右移,左移運算符
& 位 'AND'
^ | 位運算符
<= < > >= 比較運算符
<> == != 等於運算符
= %= /= //= -= += *= **= 賦值運算符
is is not 身份運算符
in not in 成員運算符
and or not 邏輯運算符

 

 

       


 

PS(時間原因,博主沒有對每一個運算符介紹,大家自行查閱,養成查找問題習慣)        

         

 

 

 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近在項目中有這麼一個需求,就是上傳一個視頻文件,然後要獲取視頻文件的第一幀圖片,這個可以通過canvas獲取得到,得到的是一個dataURL,之後還要將這個圖片上傳到雲,這個時候如何操作就不清楚了,於是乎,google一番,總結如下: 將dataURL轉成Blob 利用formData 非同步上傳 ...
  • 工廠方法模式分為三種: 一、普通工廠模式,就是建立一個工廠類,對實現了同一介面的一些類進行實例的創建。首先看下關係圖: 舉例如下:(我們舉一個發送郵件和簡訊的例子) 首先,創建二者的共同介面: 其次,創建實現類: 最後,建工廠類: 我們來測試下: 輸出:this is sms sender! 二、多 ...
  • TCP的三次握手與四次揮手 一、TCP(Transmission Control Protocol 傳輸控制協議) 二、TCP報文段(封裝在IP數據報中) 1、埠號1)源埠號:發送方進程對應的埠號,源IP和埠的作用就是標誌報文的返回地址。2)目標埠號:對應的是接收端的進程,接收端收到數據段 ...
  • 前言 之前幾個章節,大部分都是算介紹springboot的一些外圍配置,比如日誌配置等。這章節開始,開始總結一些關於springboot的綜合開發的知識點。由於SpringBoot本身是基於Spring和SpringMvc等各類spring家族的一個解決方案,可快速進行集合。故相關知識點其實大部分都 ...
  • 相關jar包分享:struts2+hibernate3+spring3 以及aop ,mysql,以及整合必須包。 鏈接:https://pan.baidu.com/s/1nCHmSsKU0hiV8DTj_V03sQ 密碼:29nf 在學習spring和hibernate的基礎後,試著將三大框架整合 ...
  • 推薦閱讀: 大數據智慧平臺落地方案 Nginx + 阿裡雲SSL + tomcat 實現https訪問代理 永遠別忘了TD 再確認測試代碼前,先找別人幫你檢查下是否無誤。在別人做之前儘量檢查出bug並且將其處理好。代碼審查最重要規則是對即將提交的代碼中查找問題——你需要做的就是確認代碼是正確的。 2 ...
  • 前不久做了一個優惠劵的分享功能,其中一個功能就是生成一個優惠劵分享短鏈接。生成的短鏈接要求每個鏈接都是唯一的,並且長度儘可能短。在網上查了一下相關的思路,發現了一個不錯的演算法。這個演算法的思路就是用[a-zA-Z0-9]建立一個長度為62的矩陣,然後把矩陣打亂,再生成一個全局唯一的數字,再把這個數字用 ...
  • Java設計模式之【工廠模式】(簡單工廠模式,工廠方法模式,抽象工廠模式) 工廠模式出現的原因 在java中,創建一個對象最簡單的方法就是使用new關鍵字。但在一些複雜的業務邏輯中,創建一個對象不只需要new一行代碼就成了,可能需要一些列的初始化設置,或先創建一些輔助對象來創建這個對象。 在這種場景 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...