恢復內容開始 1,字元編碼 ASCII 用1個字元來表示所有的英文字母和特殊符號 GB2313(GBK)用2個字元來表示英文字母及中文字元,且決定如果兩個位元組連在一起,每個位元組的128的位置都是1的話,表示漢字,否則表示兩個英文字母。 Unicode 現在的國際標準,使用4個位元組來表示,且pytho ...
------------恢復內容開始------------
1,字元編碼
ASCII 用1個字元來表示所有的英文字母和特殊符號
GB2313(GBK)用2個字元來表示英文字母及中文字元,且決定如果兩個位元組連在一起,每個位元組的128的位置都是1的話,表示漢字,否則表示兩個英文字母。
Unicode 現在的國際標準,使用4個位元組來表示,且python3 預設使用的編碼方式為Unicode編碼形式。它可以跟各種編碼相互轉化。
比如windows操作系統預設文件使用的是GBK編碼,而Python3使用的是Unicode。
為瞭解決Unicode使用4個位元組而浪費了硬碟空間,引入了UTF-8
UTF-8 在保存到硬碟和傳輸的時候使用的是UTF-8編碼,因此在window保存文件的時候中文和其他特殊字元需要轉化成UTF-8的 格式。
2,文件傳輸
編碼和解碼的含義:
編碼是將Unicode轉化成二進位格式
str.encode()
bytes(str,encoding)
解碼是通過二進位轉化成Unicode格式
bytes.decode()
str(byte,encoding)
操作文件三種特殊的方式:
w+ 寫讀 , 這個功能基本沒什麼意義,它會創建一個新文件 ,寫一段內容,可以再把寫的內容讀出來,沒什麼卵用。
r+ 讀寫,能讀能寫,但都是寫在文件最後,跟追加一樣
a+ 追加讀,文件 一打開時游標會在文件尾部,寫的數據全會是追加的形式