python成長之路第一篇（5）文件的基本操作

一、三元運算我們在上章學習的if，，else，，有一種簡便的方法他的表達式是這樣的：變數 = 值1 if 條件 else 值2 解釋過來就是如果aaa等於sss則輸出值1否則輸出值2 二、類的概念類是面向對象編程的核心，它扮演相關數據及邏輯的容器角色。它們提供了創建“真實” 對象(也就是實例

一、三元運算

我們在上章學習的if，，else，，有一種簡便的方法

他的表達式是這樣的：變數 = 值1 if 條件 else 值2

解釋過來就是如果aaa等於sss則輸出值1否則輸出值2

二、類的概念

類是面向對象編程的核心，它扮演相關數據及邏輯的容器角色。它們提供了創建“真實”
對象(也就是實例)的藍圖。對於Python，一切事物都是對象，對象基於類創建。

如何查詢對象的類呢？

為啥分為有下劃線和沒下劃線的呢，這些又是什麼呢？本例中以查看的是列表的類，那麼這個類下麵就有了很多的方法也就是下麵看到的，帶下劃線的為內置方法，不帶下劃線的非內置方法只能表示一種方式，只能執行一種方式。也就是說這個變數是列表類型的就能使用這個列表類的所有方法

type：查看對象的類型

dir（類型名）查看類中提供的功能

help（類型名）查看類中所有詳細的功能

help（類型名.功能名稱）查看類中某功能的詳細信息

這裡只是瞭解一下至於功能後續會有專門的文章寫

Pycharm看類的方法：

三、文件操作

python是怎麼操作文件的呢？我們一起來看一下，一般來說對文件的操作有這麼幾種讀寫追加

open函數

不同模式打開文件的完全列表：

模式描述

r
以只讀方式打開文件。文件的指針將會放在文件的開頭。這是預設模式。

rb
以二進位格式打開一個文件用於只讀。文件指針將會放在文件的開頭。

r+
打開一個文件用於讀寫。文件指針將會放在文件的開頭。

rb+
以二進位格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。

w
打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。

wb
以二進位格式打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。

w+
打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。

wb+
以二進位格式打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。

a
打開一個文件用於追加。如果該文件已存在，文件指針將會放在文件的結尾。也就是說，新的內容將會被寫入到已有內容之後。如果該文件不存在，創建新文件進行寫入。

ab
以二進位格式打開一個文件用於追加。如果該文件已存在，文件指針將會放在文件的結尾。也就是說，新的內容將會被寫入到已有內容之後。如果該文件不存在，創建新文件進行寫入。

a+
打開一個文件用於讀寫。如果該文件已存在，文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在，創建新文件用於讀寫。

ab+
以二進位格式打開一個文件用於追加。如果該文件已存在，文件指針將會放在文件的結尾。如果該文件不存在，創建新文件用於讀寫。

（1）打開文件
foo = open('test','r') #open是關鍵字，test是文件的名稱，r是打開的模式為只讀
print(foo)
<_io.TextIOWrapper name='test' mode='r' encoding='cp936'>

哦?返回的是什麼東東,原來在打開文件後,foo的值等於一個迭代器,迭代器是訪問集合內元素的一種方式。迭代器對象從集合的第一個元素開始訪問，直到所有的元素都被訪問一遍後結束。迭代器不能回退，只能往前進行迭代。

那怎麼能夠看到裡面的內容呢?非常簡單

（2）載入文件內容到記憶體

read()函數:
foo = open('test','r')
foo = foo.read()
print(foo)
只需要foo 等於foo.read(),read函數的作用就是從一個打開的文件中讀取一個字元串。

據說有人不喜歡read方式來讀取文件！！這是為什呢呢？

因為：

read()的機制是將文件內容一股腦的讀入記憶體，滿足不了大家的需求

所以出現了readlines()一次性載入所有內容到記憶體，並按照行分割，合成列表

readlines()
foo = open('test','r')
ss = foo.readlines()
print(ss)
['a\n', 'bb\n', 'ccc\n', 'dddd\n', 'eeeee']
納尼\n是毛毛啊，哦原來是換行符嚇老子一跳，還有人說了 我就1M的記憶體讀1G的文件，你不是要我命麽，沒關係python還有另外的方法來處理文件
readline()
每次僅讀取一行數據，這樣我們就可以for迴圈，處理到要處理的內容退出就好了
foo = open('test','r+')
ss = foo.readline()
dd = foo.readline()
print(ss+dd)
a
bb

（3）讀取中文文件

有勤快的小同學就試了試，尼瑪為啥中文文件就報錯呢？其實呢，不是你寫錯的而是編碼問題

①編碼與解碼

對於中文文件編碼格式為gbk，所以在正常的情況下我們使用Pycharm進行調試時用的是uft-8的編碼格式所以會報錯

我們知道我們現在一般接觸三種編碼格式分別是，gbk，utf-8，unicode

unicode：萬國碼Unicode 是為瞭解決傳統的字元編碼方案的局限而產生的，它為每種語言中的每個字元設定了統一併且唯一的二進位編碼，以滿足跨語言、跨平臺進行文本轉換、處理的要求。

utf-8:UTF-8用1到6個位元組編碼UNICODE字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言

GBK：是漢字編碼標準之一中華人民共和國全國信息技術標準化技術委員會1995年12月1日制訂

那麼他們之間的關係是什麼樣的呢，其實主需要記住一點就好，gbk，utf-8它的源是unicode，所以呢請看下圖

decode是解碼，encode是編碼，也就是gbk想要轉換成utf-8就需要先把gbk解碼成unicode，然後unicode在編碼成utf-8，我們來試一下

②python2.7和3.5正常輸出中文的多種方法

這些方法主要目的都是為了把編碼變成utf-8

python2.7：

方法1：在pycharm項目目錄下用windows創建一個txt文件
foo = open('ttt.txt','r')
ss = foo.read().decode('gbk')
print ss
一
二二
三三三
四四四四
五五五五五
六六六六六六

python3.5：

0.0是不是很鬱悶他自己就可以不需要變換編碼
foo = open('ttt.txt','r')
ss = foo.read()
print (ss)
 
codecs函數重點來了：
不管是2.7還是3.5有一些特殊的情況無法輸出中文字元則我們用到codecs這個函數
 
調用了codecs函數後：
 
其實呢方法很簡單激素codecs這個函數也提供了open的方法，只需要codecs.open(‘文件名’,’打開模式’,’編碼格式’)就好了。
註意：
使用pycharm切換2.7和3.5的時候可能出現混亂建議實際測試為準
 
（4）寫入操作
python提供了這麼多種打開方式，其實常用不沒有幾個r，r+，w，w+，a，a+我們一一來看①r+啥情況我前面的東西呢！！，額好吧全被替換掉了（推薦測試使用linu畢竟都是運行在linux中）
 
②w，汗以前的內容全被替換掉了，w+就不用測試了吧
 
③a哦原來追加到最後了為毛不換行！在前面加個\n試試
 
 
（5）刪除
對於python來說沒有提供直接刪除文件內容的功能，所以只能使用語句來判斷（反正我是不知道）
例子：反正是特別麻煩後面可以使用with 來優化一下我來解釋一下，首先打開文件，for當i的內容等於ccc\n的情況下什麼也不做，否則添加入列表，因為有換行符所以有\n,最後用w+打開文件把列表中的內容寫入進去即可
 1 foo = open('text','r')
 2 aa = foo.readlines()
 3 ccc = []
 4 for i in aa:
 5     if i == 'ccc\n':
 6         continue
 7     else:
 8         ccc.append(i)
 9 foo.close()
10 
11 foe= open('text','w+')
12 for iss in ccc:
13     foe.write(iss)
14 foo.close()
刪除
（6）file對象的屬性
以下是和file對象相關的所有屬性的列表：
 
例子：
fo = open("foo.txt", "r+")
print "文件名: ", fo.name
print "是否已關閉 : ", fo.closed
print "訪問模式 : ", fo.mode
print "末尾是否強制加空格 : ", fo.softspace
結果：
文件名:  foo.txt
是否已關閉 :  False
訪問模式 :  wb
末尾是否強制加空格 :  0
（7）文件定位

大家看到上面的打開方式的列表中有一個這樣的詞語‘指針’，那麼這個指針就類似於游標定位的位置，所以在python中，就有這個定位的操作

原文件text
aaa
bbb
ddd
fff
①打開文件，為什這裡只輸出了aaa bb呢，是因為read（）後面加了個指針，指到了6，所以輸出了這個，有人還問了那指到了6應該輸出三個b啊現在怎麼是兩個呢，其實呢是因為你妹的還有個換行符占了個位置
1 foo = open('text','r+')
2 aa = foo.read(6)
3 print(aa)
4 aaa 
5 bb
文件定位-打開文件
② 查找當前位置tell()
foo = open('text','r+')
aa = foo.read(3)
ss = foo.tell()
print(aa,ss)
③把指針再次重新定位到文件開頭
1 foo = open('text','r+')
2 aa = foo.read(3)
3 print(foo.tell())
4 print(aa)
5 foo.seek(0, 0)
6 print(foo.tell())
7 3 
8 aaa 
9 0
重新定位指針

模式	描述
r	以只讀方式打開文件。文件的指針將會放在文件的開頭。這是預設模式。
rb	以二進位格式打開一個文件用於只讀。文件指針將會放在文件的開頭。
r+	打開一個文件用於讀寫。文件指針將會放在文件的開頭。
rb+	以二進位格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。
w	打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。
wb	以二進位格式打開一個文件只用於寫入。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。
w+	打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。
wb+	以二進位格式打開一個文件用於讀寫。如果該文件已存在則將其覆蓋。如果該文件不存在，創建新文件。
a	打開一個文件用於追加。如果該文件已存在，文件指針將會放在文件的結尾。也就是說，新的內容將會被寫入到已有內容之後。如果該文件不存在，創建新文件進行寫入。
ab	以二進位格式打開一個文件用於追加。如果該文件已存在，文件指針將會放在文件的結尾。也就是說，新的內容將會被寫入到已有內容之後。如果該文件不存在，創建新文件進行寫入。
a+	打開一個文件用於讀寫。如果該文件已存在，文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在，創建新文件用於讀寫。
ab+	以二進位格式打開一個文件用於追加。如果該文件已存在，文件指針將會放在文件的結尾。如果該文件不存在，創建新文件用於讀寫。