Python的語法採用縮進的方式,一般使用四個空格,並且是大小寫敏感的 字元編碼 電腦只能處理數字,如果要處理文本,必須先把文本轉換成數字才能處理 採用8個比特(bit)作為一個位元組(byte) 一個位元組能表示的最大的整數是255(二進位11111111=十進位255) 把127個字母字元編碼成一 ...
Python的語法採用縮進的方式,一般使用四個空格,並且是大小寫敏感的
字元編碼
電腦只能處理數字,如果要處理文本,必須先把文本轉換成數字才能處理
採用8個比特(bit)作為一個位元組(byte)
一個位元組能表示的最大的整數是255(二進位11111111=十進位255)
把127個字母字元編碼成一張ASCII編碼,一個字元就一個位元組,例如:A是65
把英文字母和其他語言編碼成一張Unicode編碼表,一個字元兩個位元組 例如:中是20013
把英文字母和其他語言轉化成UTF-8編碼(可變長編碼),一個英文字元是一個位元組,一個中文字元是三個位元組
python的字元串
python3版本中,字元串以Unicode編碼,支持多語言
使用函數ord()把一個字元轉化成10進位整數,例如:print(ord('A')) 輸出 65
使用函數char()把10進位整數轉化成字元,例如:print(chr(20013)) 輸出 中
如果要把字元保存在硬碟上或者在網路傳輸,需要把字元轉成位元組
調用str對象的encode()方法,把字元串轉成位元組,
例如:print("taoshihan".encode("utf-8")) 輸出 b'taoshihan'
print("陶士涵".encode("utf-8")) 輸出 b'\xe9\x99\xb6\xe5\xa3\xab\xe6\xb6\xb5'
python定義bytes數據用首碼加個b
從網路讀取數據是位元組流,使用decode(“utf-8”)來轉成字元
例如:print(b'\xe9\x99\xb6\xe5\xa3\xab\xe6\xb6\xb5'.decode("utf-8")) 輸出 陶士涵
使用函數len()計算字元串的字元個數,例如:len(“陶”) 輸出 1
給文件加編碼註釋 文件頂部加上 # -*- coding: utf-8 -*-
使用%運算符來格式化字元,進行字元串的變數替換
例如:info = "我是%s,我有%s塊錢" % ("陶士涵",10000)
print(info) 輸出:我是陶士涵,我有10000塊錢
後面括弧裡面的內容一定要和前面的順序對應好